Mellum2 di JetBrains: il modello aperto per il codice

JetBrains, l'azienda ceca nota per ambienti di sviluppo come IntelliJ IDEA, PyCharm e WebStorm usati da milioni di programmatori, ha pubblicato a fine maggio 2026 Mellum2, un modello di intelligenza artificiale aperto e specializzato nella scrittura di codice. La cosa interessante non è solo il modello in sé, ma la scelta di rilasciarlo con licenza Apache 2.0, una delle più permissive: chiunque può scaricarlo, usarlo anche a fini commerciali e integrarlo nei propri strumenti.

Un modello "focale", non un gigante generalista

Mellum2 segue una filosofia diversa da quella dei grandi modelli generalisti. JetBrains lo definisce un modello "focale": fa bene una cosa — capire e generare codice — senza pretendere di scrivere poesie o rispondere a qualunque domanda. La versione principale è Mellum2-12B-A2.5B: circa 12 miliardi di parametri totali con architettura a esperti (mixture-of-experts), di cui solo circa 2,5 miliardi attivi a ogni passaggio. Tradotto: la qualità tende a quella di un modello più grande, ma il costo di calcolo e la memoria necessaria restano contenuti, perché a ogni richiesta si "accende" solo una parte della rete.

Sono disponibili due varianti: Instruct, ottimizzata per seguire istruzioni e completare il codice, e Thinking, che ragiona passo passo prima di rispondere, utile per problemi più complessi. Entrambe sono pubblicate su Hugging Face.

Mellum2 è pensato per girare in locale come motore di assistenza al codice.

Come scaricarlo e usarlo

Servono Python con la libreria transformers e una GPU con qualche gigabyte di memoria (oppure una macchina con RAM sufficiente se si usa una versione quantizzata). Il download dei pesi si fa da Hugging Face:

# Scarica la variante Instruct
pip install -U transformers torch
huggingface-cli download JetBrains/Mellum2-12B-A2.5B-Instruct --local-dir ./mellum2

Un esempio minimo in Python per generare una funzione:

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

path = "./mellum2"
tok = AutoTokenizer.from_pretrained(path)
model = AutoModelForCausalLM.from_pretrained(path, torch_dtype=torch.bfloat16, device_map="auto")

prompt = "Scrivi una funzione Python che valida un indirizzo email con una regex e restituisce True/False. Aggiungi una docstring."
ids = tok(prompt, return_tensors="pt").to(model.device)
out = model.generate(**ids, max_new_tokens=256)
print(tok.decode(out[0], skip_special_tokens=True))

Risultato atteso: il modello restituisce una funzione is_valid_email con espressione regolare e docstring, pronta da incollare nel progetto. Chi preferisce non scrivere codice di gestione può attendere (o cercare) le versioni quantizzate in formato GGUF della community, che si caricano in strumenti come Ollama o LM Studio con un solo comando, per usare Mellum2 come motore locale di un assistente di programmazione.

A chi conviene e perché è una notizia

Il valore di Mellum2 sta in tre fattori. Primo, la licenza Apache 2.0, che lo rende davvero utilizzabile in azienda senza i vincoli di molte licenze "community". Secondo, l'efficienza: con 2,5 miliardi di parametri attivi gira su hardware accessibile, ideale per chi vuole un assistente di codice in locale, senza inviare il proprio sorgente a server esterni — un tema di privacy sentito da molte aziende. Terzo, il fatto che a rilasciarlo sia JetBrains, che conosce dall'interno il flusso di lavoro degli sviluppatori e i suoi editor sono installati ovunque.

Non è un modello pensato per chattare o per compiti generici: chi cerca un assistente tuttofare guarderà altrove. Ma per il completamento del codice, la generazione di funzioni e l'integrazione in pipeline di sviluppo, Mellum2 aggiunge un'opzione aperta, leggera e legalmente comoda a un panorama finora dominato da modelli chiusi e a pagamento.