Apple AFM 3: i modelli IA per gli sviluppatori

Apple ha presentato l'8 giugno 2026, in apertura della settimana della WWDC, la terza generazione delle sue Foundation Models (AFM 3) e — novita' piu' importante per chi sviluppa — ha annunciato che aprira' il Foundation Models framework, lo strato di intelligenza artificiale on-device che alimenta Apple Intelligence. In pratica i modelli che girano dentro l'iPhone diventano un mattone su cui qualsiasi app puo' costruire, senza chiavi API, senza costi di cloud e senza inviare i dati dell'utente a un server.

E' un cambio di passo per Cupertino, finora la piu' prudente fra i grandi nomi dell'IA. Mentre OpenAI, Google e Anthropic spingono modelli sempre piu' grandi nel cloud, Apple punta su un'idea diversa: un modello piccolo, veloce e privato che vive sul dispositivo, affiancato da modelli cloud solo quando serve davvero piu' potenza.

Cinque modelli, da on-device al cloud

AFM 3 non e' un singolo modello ma una famiglia di cinque, distribuita su due livelli. Il pezzo piu' interessante e' il modello on-device, soprannominato AFM 3 Core Advanced: un'architettura sparsa da circa 20 miliardi di parametri che ne attiva pero' solo 1–4 miliardi per ogni richiesta, grazie a una tecnica che Apple chiama Instruction-Following Pruning. Tradotto: un modello potente sulla carta ma leggero da eseguire, perche' accende solo le parti di rete che servono al compito specifico.

Sopra il livello on-device ci sono i modelli cloud, eseguiti sull'infrastruttura Private Cloud Compute: server con chip Apple progettati in modo che, secondo l'azienda, nemmeno Apple possa leggere i dati elaborati. Sono questi modelli a entrare in gioco quando una richiesta e' troppo complessa per il chip del telefono. La novita' rilevante per gli sviluppatori e' che AFM 3 ha aggiunto l'input immagini: i modelli non capiscono piu' solo testo, ma anche foto, documenti e screenshot.

Quando il modello on-device non basta, AFM 3 puo' appoggiarsi ai modelli cloud su Private Cloud Compute.

Il framework si apre: anche Claude e Gemini dentro le app Apple

La mossa piu' sorprendente e' l'apertura. Apple ha annunciato che rendera' open source il Foundation Models framework piu' avanti nell'estate, e ha aperto lo stesso strato a modelli di terze parti: uno sviluppatore potra' instradare le richieste della sua app verso Claude di Anthropic o Gemini di Google, oltre che verso i modelli Apple. E' il riconoscimento, da parte di un'azienda storicamente chiusa, che nessun singolo modello e' il migliore per ogni compito.

Sul fronte costi, Apple ha introdotto un incentivo concreto: gli sviluppatori iscritti all'App Store Small Business Program — quelli con app sotto i due milioni di download complessivi — possono usare i modelli cloud piu' recenti su Private Cloud Compute senza pagare il costo della API cloud. Per le piccole realta' italiane che fanno app, e' un modo per integrare l'IA senza la bolletta mensile dei token che caratterizza OpenAI o Anthropic.

Come usarlo: il Foundation Models framework in Swift

Per provarlo servono Xcode aggiornato e un dispositivo o simulatore con l'ultima versione di iOS/macOS che supporta Apple Intelligence. L'integrazione di base e' volutamente semplice: si importa il framework e si apre una sessione di conversazione con il modello on-device.

import FoundationModels

// Sessione con il modello on-device di Apple Intelligence
let session = LanguageModelSession()

let prompt = "Riassumi in tre punti questa recensione: \(testoRecensione)"
let risposta = try await session.respond(to: prompt)

print(risposta.content)

Il framework supporta funzioni avanzate senza dover gestire prompt grezzi. Con la generazione guidata (guided generation) si chiede al modello di restituire direttamente una struttura dati tipizzata, evitando il fragile parsing del testo:

@Generable
struct SchedaPiatto {
    @Guide(description: "Nome del piatto")
    var nome: String
    @Guide(description: "Tempo di preparazione in minuti")
    var minuti: Int
    var vegetariano: Bool
}

let scheda = try await session.respond(
    to: "Genera una scheda per una carbonara",
    generating: SchedaPiatto.self
)
print(scheda.content.nome, scheda.content.minuti)

Il framework gestisce inoltre il tool calling, cioe' la possibilita' per il modello di richiamare funzioni della tua app (cercare in un database, leggere il calendario, fare un calcolo) e usarne il risultato. Tutto questo avviene sul dispositivo: per le funzioni base non c'e' alcuna chiamata di rete, quindi l'app funziona anche offline e i dati dell'utente non escono dal telefono.

Cosa puoi farci davvero (e cosa no)

Il modello on-device e' tarato su compiti "linguistici quotidiani": riassunti, riscrittura, classificazione, estrazione di informazioni, generazione di testo breve, suggerimenti contestuali. E' perfetto per dare un tocco di intelligenza a un'app di note, un gestionale, un'app di cucina o un lettore. Non e' invece pensato per sostituire un modello di frontiera come GPT-5 o Claude su ragionamenti lunghi e complessi o su conoscenza enciclopedica aggiornata: per quei casi servono i modelli cloud o, appunto, l'instradamento verso terze parti.

Un esempio pratico: un'app di lettura puo' usare AFM 3 per generare, al volo e offline, un riassunto di un articolo e tre domande di ripasso. Con la generazione guidata, l'output arriva gia' come struttura pronta da mostrare nell'interfaccia, senza che lo sviluppatore debba "ripulire" il testo del modello.

Perche' conta per il mercato

Apple arriva a questo annuncio in una fase delicata: nelle scorse settimane si e' parlato a lungo di un Siri rinnovato che, per i compiti piu' complessi, si appoggerebbe a modelli esterni come Gemini. AFM 3 e l'apertura del framework sono la risposta sul fronte degli sviluppatori: Apple non vuole vincere la corsa al modello piu' grande, ma diventare la piattaforma su cui l'IA "gira" per centinaia di migliaia di app, con privacy e costo zero come argomenti di vendita. Per chi sviluppa in Italia, e' un'occasione concreta per aggiungere funzioni intelligenti senza dipendere da un fornitore esterno e senza spese ricorrenti.

I dati e le dichiarazioni di questo articolo sono tratti dalle comunicazioni di Apple alla WWDC 2026 e dalla documentazione per sviluppatori; le specifiche dei modelli potranno essere affinate con il rilascio pubblico del framework previsto nei mesi estivi.