Physical Address

304 North Cardinal St.
Dorchester Center, MA 02124

xAI di Elon Musk lancia il suo ultimo modello di punta, Grok 3.

La compagnia di IA di Elon Musk, xAI, ha rilasciato lunedì sera il suo ultimo modello di intelligenza artificiale di punta, Grok 3, svelando nuove capacità per le app Grok su iOS e web.

Grok, la risposta di xAI a modelli come GPT-4o di OpenAI e Gemini di Google, può analizzare immagini e rispondere a domande, e alimenta numerose funzionalità sulla rete sociale di Musk, X. Grok 3, in sviluppo da diversi mesi, era previsto per il rilascio nel 2024, ma ha mancato quella scadenza.

Il lancio di lunedì è ambizioso. “Grok 3 è un ordine di grandezza più capace di Grok 2”, ha detto Musk durante una presentazione trasmessa in diretta lunedì. “[È un] IA massimamente orientata alla verità, anche se questa verità è a volte in contrasto con ciò che è politicamente corretto”.

Per essere precisi, Grok 3 è una famiglia di modelli. Una versione più piccola, Grok 3 mini, risponde alle domande più velocemente a scapito di una certa accuratezza. Non tutti i modelli e le relative funzionalità di Grok 3 sono ancora disponibili (alcuni sono in beta), ma hanno iniziato a essere distribuiti lunedì.

xAI sostiene che Grok 3 superi GPT-4o in benchmark che includono AIME (che valuta le prestazioni di un modello su un campione di domande di matematica) e GPQA (che valuta i modelli usando problemi di fisica, biologia e chimica a livello di dottorato). Una versione preliminare di Grok 3 ha anche ottenuto punteggi competitivi in Chatbot Arena, un test crowdsourced che mette a confronto diversi modelli di IA e consente agli utenti di votare le risposte preferite, secondo xAI. xAI ha utilizzato un enorme data center a Memphis con circa 200,000 GPU per allenare Grok 3. In un post su X, Musk ha affermato che Grok 3 è stato sviluppato con “10 volte” (o giù di lì) più potenza di calcolo rispetto al suo predecessore, Grok 2, utilizzando un set di training ampliato che include atti giudiziari — e altro ancora.

Due modelli nella nuova famiglia Grok 3, Grok 3 Reasoning e Grok 3 mini Reasoning, possono “ragionare” attentamente sui problemi, simili ai modelli di “ragionamento” come l’o3-mini di OpenAI e l’R1 della compagnia cinese di IA DeepSeek. I modelli di ragionamento cercano di autocorreggersi prima di fornire risultati, il che li aiuta a evitare alcune delle insidie che normalmente intralciano i modelli.

xAI afferma che Grok 3 Reasoning supera la migliore versione di o3-mini — o3-mini-high — in diversi benchmark popolari, incluso un nuovo benchmark di matematica chiamato AIME 2025. Questi modelli di ragionamento possono essere accessibili tramite l’app Grok. Gli utenti possono chiedere a Grok 3 di “Pensare”, o — per query più difficili — sfruttare la modalità “Big Brain” per un ragionamento che impiega ulteriore potenza di calcolo. xAI descrive i modelli di ragionamento come ideali per domande di matematica, scienza e programmazione.

Musk ha detto che alcuni dei “pensieri” dei modelli di ragionamento sono oscurati nell’app Grok per prevenire la distillazione, un metodo utilizzato dagli sviluppatori di modelli di IA per estrarre conoscenza da altri modelli. Di recente, DeepSeek è stata accusata di distillare i modelli di OpenAI per creare i propri.

I modelli di ragionamento di Grok sostengono una nuova funzionalità nell’app Grok chiamata DeepSearch, la risposta di xAI agli strumenti di ricerca assistiti dall’IA come il deep research di OpenAI. DeepSearch analizza Internet e X per analizzare informazioni e fornire un abstract in risposta a una domanda.

Gli abbonati al livello Premium+ di X ($50 al mese) avranno accesso per primi a Grok 3, e altre funzionalità saranno limitate dietro un nuovo piano che xAI chiama SuperGrok. Con un prezzo di $30 al mese o $300 all’anno (se le indiscrezioni sono vere), SuperGrok sblocca ulteriori query di ragionamento e DeepSearch, e include generazione illimitata di immagini.

Nel futuro — già da circa una settimana da ora — l’app Grok guadagnerà una “modalità voce”, ha detto Musk, che darà ai modelli Grok una voce sintetizzata. Alcune settimane dopo, i modelli Grok 3 saranno disponibili tramite l’API aziendale di xAI, insieme alla capacità DeepSearch.

xAI prevede di rendere open-source Grok 2 nei prossimi mesi, ha detto Musk.

“Il nostro approccio generale è quello di rendere open-source l’ultima versione [di Grok] quando la versione successiva è completamente disponibile”, ha continuato. “Quando Grok 3 sarà maturo e stabile, che probabilmente avverrà entro pochi mesi, allora renderemo open-source Grok 2.”

Quando Musk annunciò Grok circa due anni fa, presentò il modello di IA come provocatorio, non filtrato e anti-“woke” — in generale, disposto a rispondere a domande controversie che altri sistemi di IA non affronterebbero. Ha mantenuto parte di quella promessa. Ad esempio, a Grok e Grok 2, quando è stato chiesto di essere volgari, hanno felicemente acconsentito, sfoderando un linguaggio colorito che probabilmente non si sentirebbe da ChatGPT.

Tuttavia, i modelli Grok precedenti al Grok 3 hanno esitato su argomenti politici e non hanno superato certi confini. Infatti, uno studio ha scoperto che Grok tendeva politicamente a sinistra su temi come i diritti transgender, i programmi di diversità e la disuguaglianza.

Musk ha attribuito questo comportamento ai dati di allenamento di Grok — pagine web pubbliche — e si è impegnato a “spostare Grok più vicino alla neutralità politica.” Non è ancora chiaro se xAI abbia raggiunto questo obiettivo e quali potrebbero essere le conseguenze.