JetBrains, l'azienda ceca nota per ambienti di sviluppo come IntelliJ IDEA, PyCharm e WebStorm usati da milioni di programmatori, ha pubblicato a fine maggio 2026 Mellum2, un modello di intelligenza artificiale aperto e specializzato nella scrittura di codice. La cosa interessante non è solo il modello in sé, ma la scelta di rilasciarlo con licenza Apache 2.0, una delle più permissive: chiunque può scaricarlo, usarlo anche a fini commerciali e integrarlo nei propri strumenti.
Un modello "focale", non un gigante generalista
Mellum2 segue una filosofia diversa da quella dei grandi modelli generalisti. JetBrains lo definisce un modello "focale": fa bene una cosa — capire e generare codice — senza pretendere di scrivere poesie o rispondere a qualunque domanda. La versione principale è Mellum2-12B-A2.5B: circa 12 miliardi di parametri totali con architettura a esperti (mixture-of-experts), di cui solo circa 2,5 miliardi attivi a ogni passaggio. Tradotto: la qualità tende a quella di un modello più grande, ma il costo di calcolo e la memoria necessaria restano contenuti, perché a ogni richiesta si "accende" solo una parte della rete.
Sono disponibili due varianti: Instruct, ottimizzata per seguire istruzioni e completare il codice, e Thinking, che ragiona passo passo prima di rispondere, utile per problemi più complessi. Entrambe sono pubblicate su Hugging Face.
Come scaricarlo e usarlo
Servono Python con la libreria transformers e una GPU con qualche gigabyte di memoria (oppure una macchina con RAM sufficiente se si usa una versione quantizzata). Il download dei pesi si fa da Hugging Face:
# Scarica la variante Instruct
pip install -U transformers torch
huggingface-cli download JetBrains/Mellum2-12B-A2.5B-Instruct --local-dir ./mellum2
Un esempio minimo in Python per generare una funzione:
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
path = "./mellum2"
tok = AutoTokenizer.from_pretrained(path)
model = AutoModelForCausalLM.from_pretrained(path, torch_dtype=torch.bfloat16, device_map="auto")
prompt = "Scrivi una funzione Python che valida un indirizzo email con una regex e restituisce True/False. Aggiungi una docstring."
ids = tok(prompt, return_tensors="pt").to(model.device)
out = model.generate(**ids, max_new_tokens=256)
print(tok.decode(out[0], skip_special_tokens=True))
Risultato atteso: il modello restituisce una funzione is_valid_email con espressione regolare e docstring, pronta da incollare nel progetto. Chi preferisce non scrivere codice di gestione può attendere (o cercare) le versioni quantizzate in formato GGUF della community, che si caricano in strumenti come Ollama o LM Studio con un solo comando, per usare Mellum2 come motore locale di un assistente di programmazione.
A chi conviene e perché è una notizia
Il valore di Mellum2 sta in tre fattori. Primo, la licenza Apache 2.0, che lo rende davvero utilizzabile in azienda senza i vincoli di molte licenze "community". Secondo, l'efficienza: con 2,5 miliardi di parametri attivi gira su hardware accessibile, ideale per chi vuole un assistente di codice in locale, senza inviare il proprio sorgente a server esterni — un tema di privacy sentito da molte aziende. Terzo, il fatto che a rilasciarlo sia JetBrains, che conosce dall'interno il flusso di lavoro degli sviluppatori e i suoi editor sono installati ovunque.
Non è un modello pensato per chattare o per compiti generici: chi cerca un assistente tuttofare guarderà altrove. Ma per il completamento del codice, la generazione di funzioni e l'integrazione in pipeline di sviluppo, Mellum2 aggiunge un'opzione aperta, leggera e legalmente comoda a un panorama finora dominato da modelli chiusi e a pagamento.




