poolside apre Laguna M.1: modello open per il coding

Il 15 giugno 2026 il laboratorio statunitense poolside ha pubblicato su Hugging Face i pesi aperti di Laguna M.1, il suo modello di punta per la programmazione assistita da agenti. È una mossa notevole: poolside ha costruito la sua reputazione servendo clienti governativi e grandi aziende, e fino ad aprile aveva tenuto chiuso proprio M.1, rilasciando con licenza aperta solo il fratello minore. Ora il modello più grande è scaricabile da chiunque, con licenza Apache 2.0, sia nella versione post-addestrata sia nel checkpoint base.

Per il mondo open source significa avere a disposizione un sistema progettato fin dall'inizio per il lavoro «a lungo orizzonte»: non rispondere a una singola domanda, ma portare avanti compiti di programmazione complessi che si sviluppano su molti passaggi, leggendo file, eseguendo comandi e correggendo i propri errori.

Cosa c'è dentro Laguna M.1 (e quanto è bravo)

M.1 è un modello a mixture of experts: dei suoi 225 miliardi di parametri complessivi ne attiva circa 23 miliardi per ogni token, una soluzione che permette di avere la conoscenza di un modello enorme con un costo di calcolo per risposta più contenuto. La finestra di contesto arriva a 256.000 token, abbastanza per tenere in memoria interi repository. Sul benchmark SWE-bench Verified, che misura quanti problemi reali di software un modello sa risolvere, poolside indica per M.1 un punteggio intorno al 72,5%: un risultato di alto livello tra i modelli a pesi aperti. Il fratello minore Laguna XS.2 (33 miliardi di parametri totali, 3 attivi) si ferma intorno al 68,2% ma ha il vantaggio di girare anche su una singola scheda o su un Mac ben dotato.

Laguna è pensato per compiti di programmazione lunghi e a più passaggi, non per singole risposte.

Dove si trova e quanto costa

Tutto è gratuito e ospitato su Hugging Face, sotto l'organizzazione poolside. Sono disponibili più varianti: poolside/Laguna-M.1 in precisione piena (BF16), oltre alle versioni quantizzate poolside/Laguna-M.1-FP8 e poolside/Laguna-M.1-NVFP4, più leggere, e il checkpoint poolside/Laguna-M.1-base. Per chi ha hardware modesto, la scelta giusta resta XS.2 (poolside/Laguna-XS.2 e le sue varianti FP8/INT4). La licenza Apache 2.0 consente l'uso commerciale senza royalty.

Requisiti hardware: chi può davvero eseguirlo

Va detto con chiarezza: il modello M.1 da 225 miliardi di parametri non gira su un PC normale. Anche in versione FP8 richiede più GPU professionali da decine di gigabyte di memoria ciascuna. È pensato per server e cluster. Per provare Laguna sul proprio computer, la strada realistica è XS.2 in versione quantizzata, che con 24-36 GB tra VRAM e RAM diventa gestibile.

Come provarlo passo passo (con vLLM)

Il modo più diretto per servire Laguna come API compatibile con OpenAI è vLLM. Su una macchina con GPU adeguata:

# 1) Installa vLLM in un ambiente Python
pip install vllm

# 2) Avvia il server con la variante leggera XS.2 (FP8)
vllm serve poolside/Laguna-XS.2-FP8 --trust-remote-code --port 8000

Il flag --trust-remote-code serve perché il modello usa codice personalizzato. Una volta avviato il server, lo si interroga come un endpoint OpenAI:

curl http://localhost:8000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "poolside/Laguna-XS.2-FP8",
    "messages": [
      {"role": "user", "content": "Scrivi una funzione Python che legge un CSV e restituisce la media della colonna prezzo. Aggiungi la gestione degli errori."}
    ]
  }'

Ci si aspetta una funzione completa con apertura del file, parsing del CSV, calcolo della media e un blocco try/except per i casi di file mancante o colonna assente. Per scaricare i pesi in anticipo si può usare huggingface-cli download poolside/Laguna-XS.2-FP8.

Quando ha senso usarlo e quando no

Laguna conviene a chi vuole un assistente di programmazione potente da ospitare in proprio, per ragioni di riservatezza del codice o di costi a volume, e a chi costruisce agenti di sviluppo. Per l'uso quotidiano leggero, però, un servizio cloud già pronto come ChatGPT, Claude o Gemini resta più semplice. E chi non ha GPU dedicate farà prima ad affidarsi a XS.2 o alle alternative open già diffuse, come i modelli della famiglia Qwen o DeepSeek. Il valore della mossa di poolside sta soprattutto nel segnale: un laboratorio nato per il mercato enterprise che apre il suo modello migliore alza l'asticella di ciò che si può scaricare gratis.