I modelli di intelligenza artificiale stanno proliferando a un ritmo vertiginoso, proposti da tutti, dalle grandi aziende tecnologiche come Google fino a startup come OpenAI e Anthropic. Tenere traccia degli ultimi modelli può essere travolgente.
Aggiungendo confusione, i modelli di IA sono spesso promossi sulla base di benchmark di settore. Tuttavia, queste metriche tecniche rivelano spesso poco su come persone reali e aziende li utilizzino effettivamente.
Per fare chiarezza, Futuretech ha compilato una panoramica dei modelli di IA più avanzati rilasciati dal 2024, con dettagli su come utilizzarli e per cosa sono più adatti. Aggiorneremo questa lista anche con i lanci più recenti.
Ci sono letteralmente oltre un milione di modelli di IA: per esempio, HuggingFace ospita oltre 1,4 milioni. Quindi, questa lista potrebbe tralasciare alcuni modelli che si comportano meglio, in un modo o nell’altro.
Modelli di IA rilasciati nel 2025
- OpenAI o3-mini: Questo è il più recente modello di ragionamento di OpenAI ed è ottimizzato per compiti legati a STEM come programmazione, matematica e scienza. Non è il modello più potente di OpenAI, ma poiché è più piccolo, l’azienda afferma che ha un costo significativamente inferiore. È disponibile gratuitamente ma richiede un abbonamento per gli utenti intensivi.
- OpenAI Deep Research: Progettato per effettuare ricerche approfondite su un argomento con citazioni chiare. Questo servizio è disponibile solo con l’abbonamento Pro da $200 al mese di ChatGPT. OpenAI lo raccomanda per tutto, dalla ricerca scientifica allo shopping, ma attenzione che le allucinazioni rimangono un problema per l’IA.
- Mistral Le Chat: Mistral ha lanciato versioni app di Le Chat, un assistente personale multimodale IA. Mistral sostiene che Le Chat risponda più rapidamente di qualsiasi altro chatbot. Dispone anche di una versione a pagamento con giornalismo aggiornato dall’AFP. Test di Le Monde hanno trovato impressionante la performance di Le Chat, anche se ha commesso più errori di ChatGPT.
- OpenAI Operator: Inteso come un tirocinante personale che può fare cose in modo indipendente, come aiutarti a comprare la spesa. Richiede un abbonamento ChatGPT pro da $200 al mese. Gli agenti IA sono molto promettenti, ma sono ancora sperimentali: un recensore del Washington Post dice che Operator ha deciso da solo di ordinare una dozzina di uova per $31, pagate con la carta di credito del recensore.
- Google Gemini 2.0 Pro Experimental: Il tanto atteso modello di punta di Google Gemini afferma di eccellere nella programmazione e nella comprensione della conoscenza generale. Ha anche una finestra di contesto super lunga di 2 milioni di token, utile per gli utenti che hanno bisogno di elaborare rapidamente grandi quantità di testo. Il servizio richiede (al minimo) un abbonamento Google One AI Premium di $19,99 al mese.
Modelli di IA rilasciati nel 2024
- DeepSeek R1: Questo modello cinese di IA ha conquistato la Silicon Valley. DeepSeek’s R1 si comporta bene nella programmazione e nella matematica, mentre la sua natura open source significa che chiunque può eseguirlo localmente. Inoltre, è gratuito. Tuttavia, R1 integra la censura del governo cinese e sta affrontando crescenti divieti per il potenziale invio di dati degli utenti in Cina.
- Gemini Deep Research: Riassume i risultati di ricerca di Google in un documento semplice e ben citato. Il servizio è utile per studenti e chiunque altro abbia bisogno di un riassunto di ricerca veloce. Tuttavia, la sua qualità non è paragonabile a quella di un vero articolo revisionato dai pari. Deep Research richiede un abbonamento Google One AI Premium da $19,99.
- Meta Llama 3.3 7B: Questa è la versione più nuova e avanzata dei modelli Llama AI open source di Meta. Meta ha promosso questa versione come la più economica ed efficiente finora, soprattutto per matematica, conoscenza generale e seguimento di istruzioni. È gratuito e open source.
- OpenAI Sora: Sora è un modello che crea video realistici basati su testo. Mentre può generare intere scene piuttosto che solo clip, OpenAI ammette che spesso genera “fisica irreale”. Al momento è disponibile solo nelle versioni a pagamento di ChatGPT, a partire da Plus che costa $20 al mese.
- Alibaba Qwen QwQ-32B-Preview: Questo modello è uno dei pochi a competere con l’o1 di OpenAI su alcuni benchmark di settore, eccellendo in matematica e programmazione. Ironia della sorte per un ‘modello di ragionamento’, ha “spazio per miglioramenti nel ragionamento di senso comune”, dice Alibaba. Incorpora anche la censura del governo cinese. È gratuito e open source.
- Anthropic’s Computer Use: L’uso del computer di Claude è pensato per prendere il controllo del tuo computer per completare compiti come la programmazione o la prenotazione di un biglietto aereo, rendendolo un predecessore dell’Operatore di OpenAI. Tuttavia, l’uso del computer rimane in beta. La tariffazione è tramite API: $0,80 per milione di token di input, e $4 per milione di token di output.
- x.AI’s Grok 2: x.AI, la compagnia di IA di proprietà di Elon Musk, ha lanciato una versione migliorata del suo chatbot di punta Grok 2 che sostiene sia “tre volte più veloce”. Gli utenti gratuiti sono limitati a 10 domande ogni due ore su Grok, mentre gli abbonati ai piani Premium e Premium+ di X godono di limiti di utilizzo più elevati. x.AI ha anche lanciato un generatore di immagini, Aurora, che produce immagini altamente fotorealistiche, incluso contenuto grafico o violento.
- OpenAI o1: La famiglia o1 di OpenAI è pensata per produrre risposte migliori “ragionando” attraverso le risposte attraverso una funzione di ragionamento nascosta. Il modello eccelle nella programmazione, matematica e sicurezza, sostiene OpenAI, ma ha problemi anche a ingannare gli umani. O1 richiede l’abbonamento a ChatGPT Plus, che costa $20 al mese.
- Anthropic’s Claude Sonnet 3.5: Claude Sonnet 3.5 è un modello che Anthropic sostiene essere il migliore della sua classe. È diventato noto per le sue capacità di programmazione ed è considerato il chatbot di scelta degli insider tecnologici. Il modello può essere accesso gratuitamente su Claude sebbene gli utenti intensivi necessiteranno di un abbonamento Pro da $20 al mese. Mentre può comprendere le immagini, non può generarle.
- OpenAI GPT 4o-mini: OpenAI ha pubblicizzato GPT 4o-mini come il suo modello più accessibile e veloce finora grazie alle sue piccole dimensioni. È pensato per abilitare una vasta gamma di compiti come alimentare i chatbot del servizio clienti. Il modello è disponibile sul livello gratuito di ChatGPT. È più adatto per compiti semplici ad alto volume rispetto a quelli più complessi.
- Cohere Command R+: Il modello Command R+ di Cohere eccelle nelle applicazioni complesse di Generazione Potenziata dal Recupero (o RAG) per le imprese. Ciò significa che può trovare e citare specifici pezzi di informazioni molto bene. (L’inventore di RAG lavora effettivamente presso Cohere.) Tuttavia, RAG non risolve completamente il problema delle allucinazioni dell’IA.