ElevenLabs Music v2: cos'e e come usarla via API

ElevenLabs, l'azienda nota soprattutto per le voci sintetiche realistiche, ha rilasciato a metà giugno 2026 Music v2, la nuova generazione del suo modello di generazione musicale. La data ufficiale è il 15 giugno, con aggiornamenti proseguiti nei giorni successivi. La novità principale è il controllo: dove il precedente music_v1 partiva da un singolo prompt testuale, Music v2 introduce piani di composizione a blocchi che permettono di guidare struttura, ritmo e arrangiamento del brano con molta più precisione.

È un prodotto pensato soprattutto per chi sviluppa: integratori, autori di app, studi che producono contenuti audio su scala. Vediamo cosa cambia e come provarlo concretamente.

Cosa introduce Music v2

Il cuore della novità sono i «composition plan», piani di composizione costruiti da segmenti chiamati GenerationChunk e AudioRefChunk. In pratica, invece di descrivere il brano con una sola frase, si può comporlo a pezzi: definire una strofa, un ritornello, una coda, indicando per ciascuno durata e caratteristiche. Su Music v2 le durate delle sezioni sono sempre rispettate, un dettaglio prezioso per chi deve sincronizzare la musica a un video di lunghezza fissa.

Migliora anche la qualità audio: sono supportati i formati mp3_48000_240 e mp3_48000_320, cioè fino a 320 kbps, e quando il formato è impostato su automatico il modello sceglie 192 kbps invece dei precedenti 128. Tre nuove modalità di generazione coprono usi diversi: track per un brano completo, loop per cicli ripetibili senza stacco, ambience per atmosfere sonore di sottofondo.

Music v2 introduce piani di composizione a blocchi e modalita track, loop e ambience. Foto: Pexels

Come chiamare il modello via API

Per usare Music v2 basta impostare il parametro model_id su music_v2 nelle chiamate agli endpoint di generazione. Si può includere il piano di composizione direttamente nella richiesta oppure generarlo prima con l'apposito endpoint. Il sistema accetta sia i piani in formato v1 sia quelli v2, così la migrazione è graduale. Ecco un esempio semplificato di richiesta con Python:

import requests

resp = requests.post(
    "https://api.elevenlabs.io/v1/music",
    headers={"xi-api-key": "LA_TUA_API_KEY"},
    json={
        "model_id": "music_v2",
        "prompt": "Brano cinematografico epico, archi e percussioni, 90 secondi",
        "generation_mode": "track",
        "output_format": "mp3_48000_320"
    },
)
with open("brano.mp3", "wb") as f:
    f.write(resp.content)
print("File salvato: brano.mp3")

Il risultato atteso è un file MP3 ad alta qualità pronto all'uso. Per un controllo più fine si sostituisce il prompt unico con un piano di composizione che elenca le sezioni del brano, ciascuna con la propria durata e descrizione.

Dove si usa, quanto costa e i limiti

Music v2 è accessibile attraverso la piattaforma di ElevenLabs, sia dall'interfaccia web sia dall'API. I prezzi seguono il modello a consumo dell'azienda, basato su crediti: il piano gratuito consente di provare la generazione con limiti mensili, mentre per un uso intensivo o commerciale servono i piani a pagamento. La documentazione ufficiale, riportata nel changelog, elenca i dettagli aggiornati di endpoint e formati.

Il nodo più importante, soprattutto per un uso professionale, riguarda i diritti e le licenze: prima di pubblicare musica generata in un prodotto commerciale, conviene verificare i termini d'uso del piano scelto. Sul fronte creativo, Music v2 si colloca tra gli strumenti più orientati allo sviluppo: chi cerca un'esperienza più immediata, da «scrivi una frase e ottieni una canzone», troverà più comode piattaforme come Suno. Chi invece deve integrare la generazione musicale dentro un'applicazione, sincronizzarla a contenuti o controllarne la struttura, trova qui il livello di precisione che il prompt singolo non offriva.