OpenAI ha annunciato il lancio del nuovo agente ChatGPT, uno strumento potenziato che consente al modello di gestire compiti complessi in autonomia utilizzando un computer virtuale. L’agente unificato, distribuito a partire da luglio 2025 per gli utenti Pro, Plus e Team, è il risultato dell’integrazione delle funzionalità di Operator e Deep Research, due strumenti precedentemente distinti. Può interagire con siti web, compilare moduli online, generare presentazioni e fogli Excel, accedere a API pubbliche, utilizzare un browser testuale o visivo e perfino lavorare in ambienti protetti come Google Drive o SharePoint, sempre nel rispetto del controllo utente.
Disponibile in anteprima a pagamento, l’agente ha un limite di 400 richieste mensili per gli abbonati Pro e 40 per gli altri, mentre il rilascio per utenti Enterprise ed Education è previsto per l’estate. Non è stato comunicato quando o se sarà disponibile per gli utenti gratuiti.
L’agente ChatGPT è progettato per flussi di lavoro interattivi e iterativi: gli utenti possono intervenire in tempo reale, modificare le istruzioni o mettere in pausa l’attività. Il sistema è in grado di riprendere dal punto esatto in cui era stato interrotto, adattandosi ai nuovi input senza perdere il contesto. Secondo quanto riportato da Yash Kumar, responsabile di prodotto, “un’attività media con l’agente richiede circa 10 o 15 minuti”, ma può arrivare anche a un’ora per compiti complessi, come ordinare dolci online o creare report finanziari.
Tra le funzionalità più richieste, la possibilità di automatizzare ricerche, analisi, confronti tra concorrenti e creazione di documenti formattati secondo le preferenze dell’utente. Durante una dimostrazione per Wired US, l’agente è stato impiegato per organizzare appuntamenti, estrarre dati da fogli Excel e costruire presentazioni trimestrali per società quotate. In un altro caso, Isa Fulford, ricercatrice del team OpenAI, lo ha usato per ordinare “un sacco di cupcake”, affermando: “Ci è voluta quasi un’ora, ma è stato più facile che farlo da sola”.
Il modello, spiega OpenAI, è stato addestrato per selezionare dinamicamente il metodo migliore per ogni fase dell’attività, passando con fluidità dal ragionamento all’azione, e scegliendo di volta in volta se utilizzare API, browser testuale o browser visuale. La funzione di “replay”, che consente di visualizzare il percorso seguito dall’agente durante l’esecuzione, fornisce trasparenza e tracciabilità.
In termini di sicurezza, l’agente applica misure di controllo per evitare abusi o errori nei siti a rischio, come social network o portali di transazioni finanziarie. In alcuni casi, l’utente è tenuto a supervisionare l’attività con una modalità di controllo attivo, ispirata alla funzione “watch mode” del precedente Operator.
L’agente ChatGPT non include al momento la funzione di memoria, anche se l’integrazione è prevista per le versioni future. “Non è che non pensiamo sia sicura, stiamo solo adottando una precauzione in più”, ha dichiarato Kumar, citando il rischio di prompt injection come motivo per cui OpenAI preferisce procedere con cautela.
(Foto di copertina creata con ChatGPT)