Categorie
Tecnologia

La nuova AI di Meta può comporre una canzone partendo da un testo

Author: Wired

Ancora un passo avanti per Meta verso l’evoluzione dell’AI generativa. Il team di ricerca Audiocraft ha da poco rilasciato MusicGen, un modello linguistico open source in grado di comporre un brano musicale partendo da un prompt di testo, con la possibilità di allinearlo a una melodia già esistente. Il funzionamento è molto simile a quello di ChatGpt, permettendo agli utenti di descrivere la musica che si vuole generare, fornendo indicazioni come “una canzone pop degli anni ’80 con batteria pesante e synth pad in sottofondo”. O, come riferito dal portale di settore The Decoder, combinando un prompt di testo come “una traccia EDM leggera e allegra con batteria sincopata, pad ariosi e forti emozioni, tempo: 130 BPM” alla celebre melodia “Toccata e fuga in Re minore” di Johann Sebastian Bach.

Twitter content

This content can also be viewed on the site it originates from.

Una volta inseriti i “comandi”, gli utenti non dovranno far altro che cliccare sul pulsante “Genera” per ottenere il brano musicale che si desiderano. Una funzionalità resa possibile grazie a una formazione attenta e accurata dell’AI di Meta, per cui il team di Audiocraft ha utilizzato ben 20.000 ore di musica di cui detiene i diritti, tra cui un set interno di 10.000 brani musicali di alta qualità, oltre a dati musicali mutuati da Shutterstock e Pond5. E per rendere più veloce il processo di generazione, i ricercatori hanno scelto di utilizzare il tokenizer audio EnCodec a 32Khz di Meta, che consente di generare blocchi di musica più piccoli, elaborabili anche in parallelo.

Insomma, Meta ha messo a punto uno strumento che può davvero rivelarsi utile per i compositori e i musicisti di ogni genere, dimostrandosi in grado di ottenere risultati migliori rispetto agli altri modelli musicali in circolazione Riffusion e Musai, o anche lo stesso MusicLM di Google. A quanto pare, MusicGen è in grado di produrre musica ben più vicina a quella richiesta dagli utenti con il prompt di testo, dimostrandosi di fatto più efficiente. E questo è solo il primo passo di Meta verso la conquista del settore.

Author: Wired

Ancora un passo avanti per Meta verso l’evoluzione dell’AI generativa. Il team di ricerca Audiocraft ha da poco rilasciato MusicGen, un modello linguistico open source in grado di comporre un brano musicale partendo da un prompt di testo, con la possibilità di allinearlo a una melodia già esistente. Il funzionamento è molto simile a quello di ChatGpt, permettendo agli utenti di descrivere la musica che si vuole generare, fornendo indicazioni come “una canzone pop degli anni ’80 con batteria pesante e synth pad in sottofondo”. O, come riferito dal portale di settore The Decoder, combinando un prompt di testo come “una traccia EDM leggera e allegra con batteria sincopata, pad ariosi e forti emozioni, tempo: 130 BPM” alla celebre melodia “Toccata e fuga in Re minore” di Johann Sebastian Bach.

Twitter content

This content can also be viewed on the site it originates from.

Una volta inseriti i “comandi”, gli utenti non dovranno far altro che cliccare sul pulsante “Genera” per ottenere il brano musicale che si desiderano. Una funzionalità resa possibile grazie a una formazione attenta e accurata dell’AI di Meta, per cui il team di Audiocraft ha utilizzato ben 20.000 ore di musica di cui detiene i diritti, tra cui un set interno di 10.000 brani musicali di alta qualità, oltre a dati musicali mutuati da Shutterstock e Pond5. E per rendere più veloce il processo di generazione, i ricercatori hanno scelto di utilizzare il tokenizer audio EnCodec a 32Khz di Meta, che consente di generare blocchi di musica più piccoli, elaborabili anche in parallelo.

Insomma, Meta ha messo a punto uno strumento che può davvero rivelarsi utile per i compositori e i musicisti di ogni genere, dimostrandosi in grado di ottenere risultati migliori rispetto agli altri modelli musicali in circolazione Riffusion e Musai, o anche lo stesso MusicLM di Google. A quanto pare, MusicGen è in grado di produrre musica ben più vicina a quella richiesta dagli utenti con il prompt di testo, dimostrandosi di fatto più efficiente. E questo è solo il primo passo di Meta verso la conquista del settore.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.