Qwen 3.7 Max di Alibaba: come usarlo e i prezzi

Alibaba ha presentato il 20 maggio 2026, al suo Cloud Summit, Qwen 3.7 Max, il nuovo modello di punta della famiglia Qwen. Non e' pensato per vincere la gara del chatbot piu' brillante in una singola risposta, ma per un obiettivo diverso: lavorare come un agente, cioe' portare avanti compiti complessi per ore, chiamare strumenti e completare attivita' di programmazione con poco intervento umano.

E' la dichiarazione di intenti piu' chiara del team Qwen, di gran lunga il piu' prolifico tra gli sviluppatori di modelli di frontiera nel 2026. E conferma quanto i laboratori cinesi siano ormai stabilmente nella parte alta delle classifiche.

Cosa sa fare: agente, non solo chatbot

Qwen 3.7 Max e' costruito attorno all'idea di autonomia. Integra una modalita' di "pensiero esteso" che gli permette di ragionare a lungo prima di rispondere, ed e' ottimizzato per il cosiddetto tool calling: la capacita' di invocare funzioni esterne (cercare sul web, eseguire codice, interrogare un database) in sequenza, decidendo da solo quali passi compiere. E' il profilo ideale per costruire assistenti che svolgono interi flussi di lavoro, non solo singole domande e risposte.

I punti di forza dichiarati sono il coding, le attivita' da ufficio e la produttivita'. Alibaba lo posiziona come motore per agenti software capaci di affrontare compiti di ingegneria reali, dalla scrittura al debug fino al completamento di task multi-step.

I numeri: benchmark e finestra da 1 milione di token

La caratteristica che salta all'occhio e' la finestra di contesto da 1 milione di token, con un output massimo di 65.536 token: significa poter dare in pasto al modello interi repository di codice o documentazioni enormi senza spezzettarli. Sui benchmark, Qwen 3.7 Max segna un Intelligence Index v4.0 di 56,6 - il punteggio piu' alto tra i modelli cinesi - e tra i risultati spiccano 50,8% su Terminal-Bench Hard e un tasso di allucinazione del 22,9%, tra i piu' bassi della categoria.

Non e' tutto: il modello e' competitivo su prove di coding agentico come SWE-Pro e su test scientifici come GPQA Diamond, dove si avvicina ai migliori modelli occidentali. Il messaggio e' che il divario con la frontiera americana, per molti compiti pratici, e' ormai sottile.

Qwen 3.7 Max e' pensato per gli agenti che eseguono compiti di programmazione.

Quanto costa e dove si trova

Qwen 3.7 Max e' un modello proprietario, senza pesi aperti: si usa solo via API o tramite l'app web. E' disponibile su Alibaba Cloud Model Studio (la piattaforma DashScope), su OpenRouter e su Together AI. I prezzi cambiano a seconda del fornitore: su DashScope si parte da circa 2,50 dollari per milione di token in ingresso e 7,50 in uscita; su OpenRouter il listino indicato e' piu' aggressivo, intorno a 1,25 e 3,75 dollari, con uno sconto fino al 90% sull'input "in cache" per chi riusa lo stesso contesto.

Per chi vuole solo provarlo senza scrivere codice, c'e' Qwen Chat (chat.qwen.ai), che offre un accesso gratuito in anteprima, con limiti, direttamente dal browser.

Come provarlo: da Qwen Chat all'API

Il modo piu' veloce e' aprire Qwen Chat, selezionare il modello e iniziare a conversare. Per integrarlo in un'applicazione conviene usare OpenRouter, che espone un'interfaccia compatibile con quella di OpenAI: chi ha gia' codice scritto per ChatGPT puo' cambiare solo l'URL e il nome del modello. Ecco un esempio in Python:

from openai import OpenAI

client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key="LA_TUA_CHIAVE_OPENROUTER",
)

resp = client.chat.completions.create(
    model="qwen/qwen3.7-max",
    messages=[
        {"role": "system", "content": "Sei un assistente di programmazione preciso."},
        {"role": "user", "content": "Scrivi una funzione Python che valida un IBAN italiano e spiega come funziona."},
    ],
)
print(resp.choices[0].message.content)

Il risultato atteso e' una funzione commentata con il controllo del codice di controllo dell'IBAN, accompagnata da una spiegazione passo passo. Aumentando il contesto si possono incollare interi file di codice e chiedere al modello di rifattorizzarli o trovarne i bug.

Pro, contro e quando ha senso

I pro: contesto enorme, ottimo rapporto qualita'/prezzo, forza nel coding e negli agenti. I contro: nessun peso aperto (quindi niente uso in locale o totale controllo sui dati), supporto solo testuale e l'inevitabile riflessione sulla giurisdizione, dato che i dati passano per fornitori cinesi - un punto da valutare per progetti che trattano informazioni sensibili. Per uno sviluppatore che cerca un modello potente ed economico per agenti e automazioni, Qwen 3.7 Max e' tra le opzioni piu' interessanti del momento; per chi ha vincoli di sovranita' dei dati, restano preferibili soluzioni europee o modelli aperti da ospitare in proprio.