Apple presenta FS-DFM, il modello AI che scrive 128 volte più velocemente
Apple ha presentato un modello linguistico capace di scrivere testi lunghi con una velocità mai raggiunta prima. Il nuovo sistema, chiamato FS-DFM, riesce a generare testi fino a 128 volte più rapidamente rispetto ai modelli tradizionali. Lo studio, sviluppato da Apple in collaborazione con la Ohio State University, è stato pubblicato su arXiv con il titolo “FS-DFM: Fast and Accurate Long Text Generation with Few-Step Diffusion Language Models”.
Per capire la portata di questa innovazione bisogna ricordare come funzionano i modelli linguistici attuali. I sistemi come ChatGPT sono modelli autoregressivi, quindi creano il testo una parola alla volta, basandosi sia sul prompt dell’utente sia su quanto scritto in precedenza. Questo processo è accurato ma lento.
I modelli di diffusione, invece, lavorano in parallelo. Generano diverse parole contemporaneamente e le migliorano progressivamente, fino a ottenere un testo coerente. Un’ulteriore evoluzione di questa idea è rappresentata dai flow-matching models, che imparano a creare il testo finale in un’unica fase, senza dover passare attraverso centinaia di passaggi.
FS-DFM riesce a combinare queste tecniche in modo sorprendente. Riesce a scrivere interi paragrafi in appena otto passaggi di raffinamento, mantenendo la stessa qualità dei modelli di diffusione che ne richiedono più di mille. Per ottenere questo risultato, Apple ha insegnato al modello a gestire in modo dinamico il numero di iterazioni necessarie, gli ha affiancato un modello “insegnante” capace di guidarlo verso la direzione giusta e ha ottimizzato ogni passaggio per evitare errori o risultati instabili.
Nei test interni, FS-DFM ha superato modelli molto più grandi su due metriche chiave: perplessità ed entropia. La prima misura quanto il testo generato sia coerente e naturale, la seconda quanto il modello sia sicuro nella scelta delle parole. Se l’entropia è troppo bassa il risultato appare monotono, se è troppo alta diventa caotico. FS-DFM mantiene l’equilibrio perfetto tra questi due estremi, scrivendo testi fluidi, precisi e mai ripetitivi.
Nonostante sia più piccolo rispetto ai modelli Dream e LLaDA da 7 e 8 miliardi di parametri, FS-DFM — nelle versioni da 0,17, 1,3 e 1,7 miliardi — ha ottenuto risultati migliori in tutti gli scenari testati. È un traguardo notevole, perché dimostra che la velocità non deve per forza sacrificare la qualità.
Apple ha fatto sapere di voler rilasciare il codice e i checkpoint del modello, per permettere ad altri ricercatori di replicare l’esperimento e proseguire lo sviluppo. Nel paper sono presenti anche esempi visivi che mostrano, parola per parola, in quale iterazione ciascun termine è stato modificato fino al risultato finale.
FS-DFM segna un nuovo passo avanti per Apple nel campo dell’intelligenza artificiale generativa. È un progetto che apre la strada a un futuro in cui le AI potranno scrivere testi complessi in modo naturale e rapidissimo, senza dover aspettare minuti per una risposta. Un’evoluzione che potrebbe rivoluzionare il modo in cui interagiamo con i modelli linguistici e con la scrittura automatica.