Stability AI sta rilasciando Stability Audio 3.0 e non si tratta di un semplice aggiornamento, come in tanti potrebbero supporre, ma di un'intera famiglia di modelli che lavorano sul suono in modo piuttosto diverso rispetto alle versioni precedenti.
Troviamo nel dettaglio ben quattro modelli, tutti però sotto il nome di Stability Audio 3.0: ce ne sono due più limitati da 459 milioni di parametri, poi un medio da 1,4 miliardi e per finire il grande da 2,7 miliardi. Per un discorso di maggiore intuitività, Stability AI li ha divisi anche per uso pratico, come se ognuno avesse un ruolo ben preciso e definito. I più "modesti" servono in principalmente per generare audio, e questo può avvenire anche in locale, con risultati che arrivano a circa due minuti o poco più: roba veloce insomma.
Per chi invece ha maggiori aspettative, anche in termini di qualità, arrivano i modelli più complessi di Stability AI, medio e grande, che promettono un qualcosa di più strutturato e soprattutto di meno "già sentito". Qui si parla di brani completi, che possono durare anche più di 6 minuti, e ci si basa specialmente sul concetto di "continuità musicale". Si va quindi alla ricerca di una coerenza totale in merito a tempo, melodia e sonorità.



























