Qwen3.7-Max di Alibaba: benchmark e come provarlo

Al Summit di Alibaba Cloud del 20 maggio 2026 il team Qwen ha presentato Qwen3.7-Max, il nuovo modello di punta della famiglia, costruito esplicitamente per i compiti 'agentici': azioni di lunga durata, uso di strumenti, coding. Due numeri lo definiscono: una finestra di contesto da 1 milione di token e un output massimo di circa 64.000 token. L'API commerciale e' attiva su Alibaba Cloud Model Studio dal 19 maggio.

Cosa promette Qwen3.7-Max

Rispetto alle generazioni precedenti, Qwen3.7-Max e' tarato sull'esecuzione autonoma di compiti complessi: pianificare, chiamare strumenti esterni, mantenere il filo su sessioni molto lunghe grazie all'enorme contesto. E' la stessa direzione presa da quasi tutti i grandi modelli del 2026, ma con un posizionamento aggressivo su prezzo e disponibilita', tipico della strategia cinese di rendere l'IA capace e a basso costo.

I benchmark agentici e di coding

Sui test piu' usati per misurare le capacita' di agente e di programmazione, Qwen3.7-Max riporta circa 69,7 su Terminal-Bench 2.0 (compiti da riga di comando), 60,6 su SWE-Bench Pro (problemi software reali) e 76,4 su MCP-Atlas (uso di strumenti via Model Context Protocol). Sono risultati che lo mettono in concorrenza diretta con i modelli di frontiera occidentali sui casi d'uso da sviluppatore, pur non primeggiando ovunque.

Con 1 milione di token di contesto Qwen3.7-Max punta su compiti lunghi e complessi.

Come provarlo gratis su Qwen Chat

Il modo piu' semplice per metterlo alla prova senza spendere e' chat.qwen.ai: creando un account gratuito si possono usare le versioni in anteprima Qwen3.7-Max-Preview e Qwen3.7-Plus-Preview, con limiti d'uso. Basta selezionare il modello dal menu in alto, attivare se serve la modalita' di ragionamento e incollare la richiesta. Un esempio utile per saggiarne le capacita' di analisi su testi lunghi:

Agisci come analista. Ti incollo il bilancio di un'azienda (testo lungo). Estrai ricavi, utile netto e debito degli ultimi tre anni in una tabella, calcola la variazione percentuale anno su anno e segnala i tre rischi principali con una frase ciascuno.

Con un contesto cosi' ampio puoi incollare documenti di decine di pagine e aspettarti che il modello ne tenga conto per intero, senza doverli spezzare.

Accesso via API e quanto costa

Per integrarlo in un'applicazione, Qwen3.7-Max e' disponibile via API su Alibaba Cloud Model Studio e su aggregatori come OpenRouter e Together AI. Il prezzo si aggira sui 2,50 dollari per milione di token in input e 7,50 in output, con l'input in cache che scende a circa 0,25 dollari: tariffe competitive per un modello di questa fascia. Su OpenRouter l'endpoint e' compatibile con lo stile OpenAI, quindi basta cambiare base URL e nome del modello in un client esistente:

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "qwen/qwen3.7-max",
    "messages": [{"role": "user", "content": "Riassumi in 5 punti i pro e i contro del lavoro da remoto."}]
  }'

Vale la pena ricordare che Qwen ha una lunga tradizione di rilasci open-weight per i modelli piu' piccoli della famiglia, scaricabili da Hugging Face e utilizzabili in locale con strumenti come Ollama: la versione 'Max', invece, resta accessibile via chat e API.

Quando sceglierlo (e i suoi limiti)

Qwen3.7-Max ha senso soprattutto in tre scenari: quando devi analizzare documenti molto lunghi sfruttando il milione di token di contesto; quando costruisci agenti che usano strumenti e devono ragionare su molti passaggi; e quando il budget conta, grazie a tariffe API piu' basse di molti concorrenti occidentali. La forte componente in lingua cinese e' un vantaggio per chi lavora su quei mercati.

I limiti vanno conosciuti. Sui benchmark non e' sempre il primo della classe: modelli come Claude Opus o GPT-5.5 restano avanti su alcuni test di coding e ragionamento complesso. C'e' poi il tema, per molte aziende europee delicato, di dove vengono elaborati i dati: usando l'API ufficiale su Alibaba Cloud le richieste passano per l'infrastruttura del gruppo cinese, un aspetto da valutare per documenti riservati o dati personali soggetti al GDPR. Per i casi sensibili, una buona strategia e' usare le varianti open-weight piu' piccole della famiglia Qwen direttamente in locale, rinunciando a un po' di qualita' in cambio del pieno controllo sui dati.