La sfida cinese ai modelli di IA occidentali si gioca sempre piu' sul codice, e l'ultima mossa porta la firma di Z.ai (il laboratorio di Zhipu AI, Pechino). A meta' giugno 2026 e' arrivato GLM-5.2, un grande modello a pesi aperti pensato soprattutto per la programmazione e i compiti agentici, che secondo le valutazioni indipendenti si colloca in cima ai modelli open su diversi benchmark di coding e arriva a insidiare i modelli chiusi di fascia alta.

Cos'e' GLM-5.2 e cosa promette

GLM-5.2 e' un modello Mixture-of-Experts che succede a GLM-5.1, distribuito con licenza MIT (i pesi sono annunciati come aperti) e dotato di una finestra di contesto fino a 1 milione di token, attivabile tramite l'identificativo glm-5.2 nella variante a contesto lungo, con un output massimo di circa 131.000 token. Offre inoltre due livelli di "sforzo di ragionamento", per bilanciare velocita' e profondita' a seconda del compito.

I numeri che lo hanno fatto notare sono quelli del coding: nelle valutazioni di terze parti raggiunge circa 62,1 su SWE-bench Pro e 81,0 su Terminal-Bench 2.1, superando — su questi specifici test — modelli come GPT-5.5 (intorno a 58,6 su SWE-bench) e Gemini 3.1 Pro. Curiosamente, Z.ai ha pubblicato pochi benchmark ufficiali al lancio, lasciando che fossero gli analisti esterni a misurarne le prestazioni.

GLM-5.2 e' progettato per coding e compiti agentici, con un contesto fino a un milione di token.

Come provarlo: dalla chat all'API

Ci sono diversi modi per mettere le mani su GLM-5.2.

  • Chat web: il modello e' incluso nel GLM Coding Plan di Z.ai, con piani che partono da circa 18 dollari al mese (Lite), passano per 72 dollari (Pro) e arrivano a 160 dollari (Max) per i carichi piu' intensi.
  • API: e' raggiungibile tramite un endpoint compatibile con lo standard OpenAI, all'indirizzo https://api.z.ai/api/coding/paas/v4. Il prezzo a consumo indicato e' di circa 1,40 dollari per milione di token in input e 4,40 dollari in output, con input in cache a 0,26 dollari.
  • Negli strumenti di coding: GLM-5.2 si integra in editor e agenti come Claude Code e Cline configurando l'endpoint compatibile OpenAI.

Ecco un esempio minimo di chiamata via terminale, sostituendo la propria chiave:

curl https://api.z.ai/api/coding/paas/v4/chat/completions \
  -H "Authorization: Bearer LA_TUA_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-5.2",
    "messages": [
      {"role": "user", "content": "Scrivi una funzione Python che valida un IBAN italiano e spiega i passaggi"}
    ]
  }'

La risposta attesa e' un blocco di codice Python con la funzione di validazione (lunghezza, codice paese, calcolo del resto secondo lo standard ISO 7064) accompagnato da una spiegazione passo passo.

Dove si colloca e a cosa fare attenzione

GLM-5.2 si aggiunge a un 2026 affollatissimo di modelli cinesi a pesi aperti orientati al codice: nelle scorse settimane sono arrivati anche Kimi K2.7 di Moonshot e MiniMax M3, segno di una concorrenza interna sempre piu' feroce. Per gli sviluppatori il vantaggio e' concreto: prestazioni di alto livello a una frazione del costo dei modelli chiusi e la possibilita', grazie alla licenza aperta, di ospitare il modello sui propri server. Resta un avvertimento ricorrente per questi servizi: usare l'API ospitata in Cina comporta valutazioni sulla riservatezza dei dati, e per progetti sensibili conviene preferire l'esecuzione self-hosted dei pesi aperti. Provarlo, comunque, costa poco: bastano una chiave API e cinque minuti per capire se regge il confronto con gli strumenti che usate ogni giorno.