Kimi K2.6: modello aperto da 1.000 miliardi di parametri

Mentre i laboratori occidentali rincorrono la frontiera con modelli chiusi, la cinese Moonshot AI continua a spingere sull'open source di alto livello. Kimi K2.6, rilasciato il 20 aprile 2026, è un modello a pesi aperti da mille miliardi di parametri con architettura Mixture-of-Experts e 32 miliardi di parametri attivi: una potenza di calcolo che, sulla carta, lo colloca tra i migliori modelli aperti del mondo, vicino ai risultati di Claude Opus 4.6 nei compiti agentici.

Kimi K2.6: un trilione di parametri aperti per gli agenti

L'architettura Mixture-of-Experts è ciò che rende sostenibile un modello così grande: dei mille miliardi di parametri totali, solo 32 miliardi vengono attivati a ogni richiesta, scegliendo gli "esperti" più adatti. Questo permette prestazioni elevate con un costo di calcolo per token molto inferiore a quello di un modello denso equivalente. Kimi K2.6 è nativamente multimodale — immagini e testo sono addestrati insieme — e ha una finestra di contesto da 200.000 token.

Moonshot distribuisce il modello a pesi aperti, con i file disponibili su Hugging Face e sul repository GitHub ufficiale, e lo declina in quattro varianti, dalla chat rapida fino alle configurazioni pensate per il lavoro agentico intensivo.

Kimi K2.6 usa un'architettura Mixture-of-Experts: 1.000 miliardi di parametri, 32 attivi per richiesta.

Lo sciame di agenti: cosa significa in pratica

La caratteristica più distintiva della famiglia Kimi è la capacità di orchestrare "sciami" di agenti. Il modello può avviare e coordinare in autonomia decine — fino a centinaia, nelle varianti più spinte — di sotto-agenti che lavorano in parallelo su parti diverse di uno stesso problema, gestendo flussi di lavoro lunghi e articolati. È un approccio pensato per i compiti complessi: scrivere e testare un'applicazione, condurre una ricerca multi-fonte, automatizzare processi che richiedono molti passaggi coordinati.

In concreto, invece di rispondere a una domanda alla volta, Kimi può scomporre un obiettivo in tante attività, distribuirle a sotto-agenti e ricomporre i risultati. È la direzione verso cui si stanno muovendo tutti i grandi laboratori, ma vederla in un modello aperto e gratuito è significativo.

Provarlo gratis: app Kimi e sito

Per provarlo senza alcuna competenza tecnica basta usare l'assistente ufficiale Kimi, disponibile sul sito (kimi.com) e tramite app per smartphone, gratuito con i consueti limiti d'uso. È il modo più rapido per testare la qualità in italiano, far analizzare immagini o documenti e valutare le capacità di ragionamento prima di passare alle API.

Usarlo via API compatibile con OpenAI

Chi vuole integrarlo nei propri progetti può registrarsi sulla piattaforma di Moonshot per ottenere una chiave. Anche qui l'API segue lo standard di OpenAI, quindi il codice è familiare:

from openai import OpenAI

client = OpenAI(
    api_key="LA_TUA_CHIAVE_MOONSHOT",
    base_url="https://api.moonshot.ai/v1",
)

risposta = client.chat.completions.create(
    model="kimi-k2.6",
    messages=[
        {"role": "user", "content": "Elenca 5 idee per automatizzare la gestione delle email con un agente IA."},
    ],
)

print(risposta.choices[0].message.content)

Il risultato atteso è un elenco di cinque proposte concrete. In alternativa, Kimi K2.6 è disponibile anche su aggregatori come OpenRouter, utili per confrontarlo con altri modelli senza aprire più account.

Gli sciami di agenti di Kimi coordinano decine di sotto-processi in parallelo.

Scaricare i pesi: serve un cluster, non un portatile

Il fatto che Kimi K2.6 sia a pesi aperti non significa che chiunque possa eseguirlo a casa. I file del modello pesano centinaia di gigabyte e richiedono server con più GPU professionali per girare a velocità accettabile. Il download da Hugging Face ha senso per università, aziende e provider cloud che vogliono ospitarlo in proprio o adattarlo; per il singolo utente o la piccola impresa, l'uso via API o tramite l'app Kimi resta l'unica strada realistica. È una distinzione importante da capire: "open weights" vuol dire libertà di accesso e di modifica, non necessariamente fattibilità su hardware di consumo.

Quando scegliere Kimi K2.6

Kimi K2.6 è interessante per chi cerca un modello aperto di altissimo livello per compiti agentici e di automazione, soprattutto se può ospitarlo su infrastruttura propria per ragioni di costo o di controllo dei dati. Per l'uso quotidiano, l'app gratuita è più che sufficiente a farsi un'idea. Resta il fatto che, per la frontiera assoluta su compiti delicati, i modelli chiusi di Anthropic, OpenAI e Google mantengono spesso un margine; ma il divario, con modelli come Kimi, si sta assottigliando in fretta.