Kimi K2.7 Code: il modello open di Moonshot per il codice

Moonshot AI, il laboratorio cinese dietro l'assistente Kimi, ha rilasciato il 12 giugno 2026 Kimi K2.7 Code, un modello open-source pensato specificamente per il coding agentico. I numeri sono da capogiro: mille miliardi di parametri totali in architettura mixture-of-experts (MoE), licenza MIT modificata e disponibilita' immediata sia via API sia come pesi scaricabili da Hugging Face. E' uno dei modelli aperti per programmare piu' potenti in circolazione.

Cosa cambia in Kimi K2.7 Code

K2.7 Code e' la versione specializzata della famiglia Kimi K2, costruita sulla stessa base da mille miliardi di parametri delle versioni K2.5 e K2.6 ma rifinita per fare di piu' con meno. "Coding agentico" significa che il modello non si limita a scrivere singoli frammenti di codice: e' pensato per operare dentro flussi di lavoro autonomi, in cui legge un repository, pianifica le modifiche, esegue comandi e itera fino a completare un compito.

L'architettura mixture-of-experts e' la chiave dell'efficienza: dei mille miliardi di parametri totali, solo circa 32 miliardi sono "attivi" a ogni passaggio, selezionati tra 384 esperti specializzati. In questo modo il modello ha la conoscenza di un gigante ma il costo di calcolo di un modello molto piu' piccolo. La finestra di contesto e' di 256.000 token.

Kimi K2.7 Code e' progettato per gli agenti che leggono, modificano e testano il codice.

I numeri e l'efficienza dei token

Il miglioramento piu' apprezzato riguarda l'efficienza del ragionamento: rispetto alla versione K2.6, Moonshot dichiara una riduzione di circa il 30% nei "token di pensiero", cioe' nel testo che il modello genera internamente per ragionare prima di rispondere. Tradotto in pratica: risposte di pari qualita' a un costo inferiore, perche' si pagano meno token.

Sui benchmark interni, l'azienda riporta guadagni netti rispetto a K2.6 su diversi test di programmazione. Come sempre con i dati forniti dal produttore, vanno considerati indicativi: il valore reale si misura sul proprio caso d'uso. Ma la direzione - piu' capacita' agentica con meno spreco di token - e' esattamente quella che gli sviluppatori chiedono.

Come usarlo: API e pesi aperti

La via piu' rapida e' l'API ufficiale sulla piattaforma Kimi, con un prezzo indicato attorno a 0,95 dollari per milione di token: competitivo per un modello di questa potenza. La licenza e' una MIT modificata, che consente l'uso commerciale con attribuzione per i dispiegamenti su larga scala.

Per chi preferisce eseguire il modello in proprio, i pesi sono su Hugging Face. Vista la dimensione, l'esecuzione locale e' realistica solo con infrastrutture adeguate o tramite servizi di hosting che lo espongono via API. Per il download:

pip install -U huggingface_hub
huggingface-cli download moonshotai/Kimi-K2.7-Code --local-dir ./kimi-k2-7-code

In quali strumenti di coding inserirlo

Il modo piu' utile di usare K2.7 Code e' dentro un agente di programmazione. Essendo esposto via API compatibile con gli standard piu' diffusi, puo' essere collegato a editor e strumenti da riga di comando che permettono di scegliere il modello. Ecco un esempio di chiamata in stile OpenAI:

from openai import OpenAI

client = OpenAI(
    base_url="https://api.moonshot.ai/v1",
    api_key="LA_TUA_CHIAVE"
)

risposta = client.chat.completions.create(
    model="kimi-k2.7-code",
    messages=[
        {"role": "user", "content": "Trova il bug in questa funzione Python e proponi una correzione con test."}
    ]
)
print(risposta.choices[0].message.content)

Il risultato atteso e' l'individuazione del difetto, una versione corretta della funzione e uno o piu' test che ne verificano il comportamento - il classico flusso di un assistente di coding moderno.

Il rilascio di Kimi K2.7 Code conferma una tendenza ormai netta: i laboratori cinesi stanno spingendo con forza sui modelli a pesi aperti per la programmazione, da Qwen a GLM fino a DeepSeek e Moonshot. Per gli sviluppatori e' una buona notizia: piu' concorrenza significa modelli migliori, prezzi piu' bassi e la possibilita' di scegliere strumenti che si possono eseguire e controllare in autonomia, senza essere legati a un unico fornitore.