Physical Address

304 North Cardinal St.
Dorchester Center, MA 02124

OpenAI aggiorna ChatGPT

Durante una livestream tenuta martedì, Sam Altman, CEO di OpenAI, ha annunciato il primo importante aggiornamento alle capacità di generazione di immagini di ChatGPT da oltre un anno a questa parte.

ChatGPT è ora in grado di creare e modificare immagini e fotografie in modo nativo grazie all’integrazione diretta del modello GPT-4o, lo stesso che da tempo alimenta la piattaforma AI conversazionale. Finora, tuttavia, GPT-4o era utilizzato esclusivamente per la generazione e modifica di testo — non per le immagini.

Altman ha confermato che la nuova funzione di generazione immagini è disponibile fin da oggi per gli utenti Pro del piano da $200 al mese, sia su ChatGPT che su Sora, il tool di generazione video AI sviluppato da OpenAI. L’azienda ha dichiarato che la funzionalità sarà distribuita a breve anche agli utenti Plus, free e agli sviluppatori tramite API.

Più dettagli, più precisione

Rispetto al modello che sostituisce — DALL·E 3 — GPT-4o impiega più tempo per generare immagini, ma restituisce risultati più accurati e ricchi di dettagli, secondo quanto affermato da OpenAI. Il nuovo sistema può modificare immagini esistenti, incluse quelle che ritraggono persone, applicando trasformazioni o aggiungendo elementi tramite inpainting (modifica di dettagli in primo piano e sfondi).

Per abilitare questa nuova funzione, OpenAI ha riferito al Wall Street Journal di aver addestrato GPT-4o su dati pubblicamente disponibili, oltre che su dati proprietari ottenuti tramite partnership con aziende come Shutterstock.

Il nodo dei dati di training

Nel settore dell’AI generativa, i dataset di training sono considerati un vantaggio competitivo. Di conseguenza, molte aziende scelgono di non divulgare i dettagli per evitare sia la concorrenza sia eventuali cause legate alla proprietà intellettuale.

“Rispettiamo i diritti degli artisti in termini di output generato e abbiamo politiche che impediscono la creazione di immagini che imitino direttamente lo stile di artisti viventi,” ha dichiarato Brad Lightcap, COO di OpenAI, in una nota al Wall Street Journal.

OpenAI ha inoltre messo a disposizione un modulo di opt-out che consente ai creatori di richiedere l’esclusione delle proprie opere dai dataset di training. L’azienda afferma anche di rispettare le richieste di non indicizzazione dei contenuti da parte dei siti web, incluse le immagini.

Concorrenza e rischi

Questo aggiornamento arriva a poca distanza dal lancio della funzione di output nativo di immagini in Gemini 2.0 Flash di Google, un altro modello AI di nuova generazione. La funzionalità ha avuto grande risonanza online — non sempre in positivo. Alcuni utenti hanno evidenziato la mancanza di protezioni, che ha permesso la rimozione di watermark e la generazione di immagini con personaggi coperti da copyright.

Implicazioni per creator e professionisti dell’AI visiva

L’aggiornamento di ChatGPT rappresenta un punto di svolta per chi lavora con contenuti visivi, dai designer ai marketer, passando per creator, sviluppatori e startup. La possibilità di generare e modificare immagini con prompt testuali, direttamente all’interno della piattaforma, riduce il tempo necessario per il prototyping creativo e apre nuove strade nel design iterativo. Allo stesso tempo, però, la questione del training data e della tutela dei diritti degli artisti resta un tema aperto, destinato a influenzare il dibattito sull’etica e la sostenibilità dell’AI generativa.

Con modelli sempre più multimodali e potenti, la concorrenza tra big tech si gioca ora non solo sulla qualità del contenuto generato, ma anche sulla fiducia degli utenti e dei creatori.

Lascia una risposta

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *