Google presenta Gemini 3: un’unica AI per testo, immagini e audio. “Ci piace pensare che aiuterà tutti a dare vita a qualsiasi idea”

Gemini 3

Google ha presentato Gemini 3, il nuovo modello di intelligenza artificiale progettato per funzionare in tutto il mondo e integrato nei principali servizi dell’azienda, con l’obiettivo di migliorare la ricerca, la produzione di contenuti e la capacità di capire testi, immagini, audio e video. La società ha spiegato che il modello nasce per aiutare utenti, sviluppatori e aziende a usare l’AI in modo più naturale e veloce. Durante il lancio, i responsabili di Google hanno definito Gemini 3 “il miglior modello al mondo” per creazione e interpretazione dei contenuti, descrivendolo come un sistema capace di trasformare diverse informazioni in un’unica forma di linguaggio digitale. Koray Kavukcuoglu, a capo dell’AI di Google, ha spiegato ai giornalisti: “È il nostro modello più intelligente. Ci piace pensare che aiuterà tutti a dare vita a qualsiasi idea”. Il nuovo modello sarà disponibile nell’app Gemini, che oggi conta oltre 650 milioni di utenti mensili, e integrato nel motore di ricerca di Google, utilizzato da più di due miliardi di persone ogni mese. La versione più potente, Gemini 3 Pro, è già accessibile agli utenti dell’app e permette di combinare testo, foto e audio come se fossero parte di uno stesso linguaggio. Con questa tecnologia, per esempio, una serie di immagini può diventare un ricettario completo, oppure un video educativo può trasformarsi in schede di ripasso generate in tempo reale. Nella modalità di ricerca potenziata dall’AI, Gemini 3 Pro offre risultati con immagini, tabelle e simulazioni, basandosi su una versione aggiornata della tecnica chiamata “query fan-out”, progettata per capire meglio l’intento di chi pone la domanda e trovare contenuti che prima non venivano individuati. Demis Hassabis, amministratore delegato di Google DeepMind, ha spiegato che l’azienda sta inserendo l’AI “ovunque” nei propri prodotti. Ha osservato che il mercato dell’intelligenza artificiale presenta segnali di possibile sopravvalutazione, ma ha aggiunto che Google utilizza già questi sistemi in servizi come Google Maps, Gmail e la ricerca. “Nello scenario peggiore, faremo ancora più affidamento su tutto questo”, ha affermato Hassabis. “In quello migliore, abbiamo il portafoglio più ampio e la ricerca più all’avanguardia”. Google ha mostrato anche gli strumenti costruiti attorno all’AI, come NotebookLM, che genera podcast partendo da documenti di testo, e AI Studio, che permette di creare versioni preliminari di applicazioni usando comandi semplici. L’azienda sta sperimentando la stessa tecnologia in settori come la robotica e il gaming, ritenuti in grado di offrire sviluppi importanti nei prossimi anni. Dal 18 novembre Gemini 3 è disponibile nell’app e all’interno di AI Overviews, la funzione che riassume automaticamente le informazioni nella ricerca. Durante le dimostrazioni, Google ha mostrato che il modello può creare grafici per spiegare concetti complessi, come il problema dei tre corpi in fisica, direttamente mentre l’utente formula la richiesta. Robby Stein, vicepresidente di Google Search, ha spiegato che nell’ultimo anno è cresciuto in modo significativo l’utilizzo delle ricerche in linguaggio naturale e che la ricerca per immagini è aumentata del 70 per cento, grazie alla capacità del modello di analizzare fotografie in modo più accurato. Negli ultimi mesi, Google ha accelerato i propri investimenti nel settore per recuperare terreno dopo l’arrivo di ChatGPT nel 2022, che aveva portato OpenAI al centro del dibattito sull’AI. Oggi, secondo Bloomberg, Google sarebbe vicina a un accordo con Apple per integrare Gemini in Siri, mentre il nuovo strumento di generazione di immagini Nano Banana sta ottenendo un forte interesse da parte degli utenti. Nel report pubblicato a luglio, Alphabet ha comunicato che AI Overviews ha contribuito a un aumento del 10 per cento delle ricerche effettuate tramite Google. Nel frattempo, il nuovo modello GPT-5 di OpenAI non ha soddisfatto alcune aspettative del settore, con commenti sul tono ritenuto troppo formale e su prestazioni considerate meno incisive del previsto. Google ha presentato Gemini 3 come un sistema in grado di migliorare i servizi esistenti e di funzionare come base per il prossimo ciclo di innovazioni legate all’AI.

ChatGPT apre ai contenuti erotici per adulti verificati

Sam-Altman-openai

Da dicembre 2025, gli utenti adulti di ChatGPT potranno accedere a conversazioni con contenuti erotici, ma solo dopo una verifica dell’età. Lo ha annunciato Sam Altman, amministratore delegato di OpenAI, in un post pubblicato sulla piattaforma X, spiegando che “gli utenti adulti saranno trattati come adulti” quando la società avrà completato l’implementazione dei nuovi limiti di età. Si tratta di un cambio importante nella politica di OpenAI, che finora ha vietato ogni tipo di contenuto per adulti all’interno delle conversazioni di ChatGPT. Altman ha precisato che le versioni precedenti del chatbot erano state rese “piuttosto restrittive” per proteggere gli utenti da rischi legati alla salute mentale, ma questo ha finito per rendere l’intelligenza artificiale “meno utile per molti”. Secondo l’amministratore delegato, la nuova impostazione permetterà agli utenti di scegliere anche diverse personalità del chatbot, con comportamenti e stili comunicativi personalizzati. Queste funzioni saranno basate sull’ultimo aggiornamento di GPT-4o, la versione più recente del sistema di linguaggio di OpenAI. “Tra qualche settimana – ha scritto Altman – pubblicheremo una nuova versione di ChatGPT. Se vuoi che risponda in modo molto umano o usi un sacco di emoji, o si comporti come un amico, dovrebbe farlo ma solo se lo desideri tu”. Per la gestione dei contenuti per adulti, la piattaforma utilizzerà un sistema di verifica dell’età, necessario per accedere alle nuove funzioni. Nelle ultime settimane OpenAI ha già introdotto un’esperienza dedicata ai minorenni, che blocca automaticamente materiale esplicito e adatta le risposte all’età dell’utente. La società sta inoltre sperimentando una tecnologia predittiva in grado di stimare se un utente ha più o meno di 18 anni, analizzando il suo comportamento durante l’interazione. L’annuncio ha attirato l’attenzione anche delle autorità europee, impegnate a rafforzare le regole sulla protezione dei minori online. L’Unione Europea, attraverso la legge sui servizi digitali (DSA), ha chiesto ai principali operatori tecnologici di spiegare come intendano garantire la sicurezza dei più giovani. In parallelo, negli Stati Uniti, la Federal Trade Commission ha richiesto informazioni a varie aziende, tra cui OpenAI e xAI di Elon Musk, per valutare l’impatto dei chatbot sui minori. Il tema dei comportamenti dannosi e della dipendenza emotiva legata all’uso dell’intelligenza artificiale è oggetto di crescente attenzione. Di recente, alcune segnalazioni hanno evidenziato casi di utenti che sviluppano legami affettivi con i chatbot. Un sondaggio del Centre for Democracy and Technology, un’organizzazione no-profit statunitense, ha indicato che uno studente su cinque ha tentato di instaurare una relazione sentimentale con un’IA. La decisione di OpenAI arriva in un contesto competitivo in cui diverse aziende stanno esplorando forme di interazione più umane tra utenti e intelligenze artificiali. Tra i rivali di ChatGPT, la piattaforma Grok, di proprietà di Elon Musk, ha recentemente introdotto i cosiddetti “compagni animati”, tra cui personaggi digitali ispirati al mondo dei cartoni orientali. (In foto, Sam Altman)

OpenAI lancia l’agente ChatGPT: pensa e agisce da sé

OpenAI Chat GPT Agent

OpenAI ha annunciato il lancio del nuovo agente ChatGPT, uno strumento potenziato che consente al modello di gestire compiti complessi in autonomia utilizzando un computer virtuale. L’agente unificato, distribuito a partire da luglio 2025 per gli utenti Pro, Plus e Team, è il risultato dell’integrazione delle funzionalità di Operator e Deep Research, due strumenti precedentemente distinti. Può interagire con siti web, compilare moduli online, generare presentazioni e fogli Excel, accedere a API pubbliche, utilizzare un browser testuale o visivo e perfino lavorare in ambienti protetti come Google Drive o SharePoint, sempre nel rispetto del controllo utente. Disponibile in anteprima a pagamento, l’agente ha un limite di 400 richieste mensili per gli abbonati Pro e 40 per gli altri, mentre il rilascio per utenti Enterprise ed Education è previsto per l’estate. Non è stato comunicato quando o se sarà disponibile per gli utenti gratuiti. L’agente ChatGPT è progettato per flussi di lavoro interattivi e iterativi: gli utenti possono intervenire in tempo reale, modificare le istruzioni o mettere in pausa l’attività. Il sistema è in grado di riprendere dal punto esatto in cui era stato interrotto, adattandosi ai nuovi input senza perdere il contesto. Secondo quanto riportato da Yash Kumar, responsabile di prodotto, “un’attività media con l’agente richiede circa 10 o 15 minuti”, ma può arrivare anche a un’ora per compiti complessi, come ordinare dolci online o creare report finanziari. Tra le funzionalità più richieste, la possibilità di automatizzare ricerche, analisi, confronti tra concorrenti e creazione di documenti formattati secondo le preferenze dell’utente. Durante una dimostrazione per Wired US, l’agente è stato impiegato per organizzare appuntamenti, estrarre dati da fogli Excel e costruire presentazioni trimestrali per società quotate. In un altro caso, Isa Fulford, ricercatrice del team OpenAI, lo ha usato per ordinare “un sacco di cupcake”, affermando: “Ci è voluta quasi un’ora, ma è stato più facile che farlo da sola”. Il modello, spiega OpenAI, è stato addestrato per selezionare dinamicamente il metodo migliore per ogni fase dell’attività, passando con fluidità dal ragionamento all’azione, e scegliendo di volta in volta se utilizzare API, browser testuale o browser visuale. La funzione di “replay”, che consente di visualizzare il percorso seguito dall’agente durante l’esecuzione, fornisce trasparenza e tracciabilità. In termini di sicurezza, l’agente applica misure di controllo per evitare abusi o errori nei siti a rischio, come social network o portali di transazioni finanziarie. In alcuni casi, l’utente è tenuto a supervisionare l’attività con una modalità di controllo attivo, ispirata alla funzione “watch mode” del precedente Operator. L’agente ChatGPT non include al momento la funzione di memoria, anche se l’integrazione è prevista per le versioni future. “Non è che non pensiamo sia sicura, stiamo solo adottando una precauzione in più”, ha dichiarato Kumar, citando il rischio di prompt injection come motivo per cui OpenAI preferisce procedere con cautela. (Foto di copertina creata con ChatGPT)

ChatGPT crea immagini Ghibli: arte o violazione del diritto?

ChatGPT e Ghibli

Negli ultimi giorni, una massiccia diffusione online di immagini in stile Studio Ghibli, generate con il nuovo sistema GPT-4o di ChatGPT, ha sollevato interrogativi legati al diritto d’autore. Il fenomeno, divenuto rapidamente virale, ha portato l’amministratore delegato di OpenAI, Sam Altman, a commentare ironicamente su X: “Le nostre GPU stanno fondendo”, alludendo all’elevato traffico verso i server dell’azienda. L’afflusso ha infatti causato temporanee limitazioni di utilizzo e messaggi di “over capacity”, in particolare sulla piattaforma video Sora. Le immagini, che richiamano i tratti visivi dell’animazione creata da Hayao Miyazaki, hanno generato un’ondata globale di ritratti e meme condivisi sui social. Tuttavia, né Miyazaki né Studio Ghibli si sono finora espressi pubblicamente sul fenomeno. La questione centrale riguarda la liceità dell’uso di stili artistici riconoscibili da parte dell’intelligenza artificiale. Secondo l’avvocato Evan Brown, esperto di proprietà intellettuale, lo stile visivo in sé non è protetto da copyright secondo la legislazione statunitense, rendendo legittima la generazione di contenuti “in stile Ghibli”, a meno che durante la fase di addestramento dell’IA non siano stati utilizzati materiali coperti da diritto d’autore. Il punto legale cruciale resta quindi la provenienza dei dati usati per il training dei modelli generativi. Se questi includono contenuti originali senza autorizzazione, si entra in una zona grigia giuridica, soggetta a interpretazioni e a procedimenti legali in corso, come quello intentato dal New York Times contro OpenAI. La stessa azienda ha dichiarato che ChatGPT evita di replicare “lo stile di artisti viventi”, pur consentendo la replica di stili attribuiti a studi di produzione. Nel caso dello Studio Ghibli, però, questa distinzione si complica: lo stile dello studio è fortemente identificabile con Miyazaki, tuttora vivente e attivo. La controversia riporta alla memoria le dichiarazioni dello stesso Miyazaki, risalenti al 2016, quando definì “un insulto alla vita” l’uso dell’intelligenza artificiale in animazione, dopo aver visionato una demo di movimento generato al computer. L’animatore giapponese ha da sempre difeso l’artigianalità e i valori umani del disegno a mano, fondando nel 1985 lo Studio Ghibli proprio per sfuggire alla produzione seriale e ai vincoli tecnici. Le immagini AI oggi in circolazione sono spesso usate fuori contesto, in forme grottesche o satiriche, comprese rielaborazioni da parte di soggetti politici come Fratelli d’Italia o Casa Bianca, fatto che alcuni utenti hanno giudicato irrispettoso del significato culturale originario dell’opera di Miyazaki. La controversia si intreccia così con riflessioni più ampie sull’automazione creativa e il concetto stesso di arte, alimentando un dibattito che riguarda sia l’estetica che la sostenibilità economica dei contenuti digitali in un’epoca di IA generativa.

New York Times prosegue la causa per violazione del copyright: OpenAI potrebbe pagare fino a 150mila dollari per articolo

the-new-york-times

La giudice federale Sidney Stein ha dato il via libera alla causa per violazione del copyright promossa dal New York Times contro OpenAI, creatrice di ChatGPT, e contro Microsoft. La decisione consente al quotidiano statunitense e ad altri gruppi editoriali, tra cui MediaNews Group e Tribune Publishing, di proseguire l’azione legale avviata nel dicembre 2023, che contesta l’uso non autorizzato di contenuti giornalistici per l’addestramento di sistemi di intelligenza artificiale. OpenAI e Microsoft avevano chiesto l’archiviazione del procedimento, sostenendo che l’utilizzo rientrasse nell’ambito del cosiddetto “fair use”, ma il tribunale ha rigettato la richiesta. Al centro della causa vi è l’accusa di aver impiegato articoli senza consenso né compenso, permettendo a chatbot come ChatGPT di generare testi che riprendono o riassumono informazioni pubblicate, potenzialmente sostituendo le fonti originali nelle ricerche online. Secondo i querelanti, ciò mette a rischio la sostenibilità economica del settore editoriale, già in difficoltà in un mercato digitale dominato da piattaforme tecnologiche. La giudice Stein ha annunciato che emetterà una sentenza definitiva in tempi rapidi, mentre la causa si inserisce in una cornice più ampia che vede numerose testate agire contro OpenAI per difendere i propri diritti d’autore. Intanto, OpenAI ha modificato ChatGPT per evitare la riproduzione testuale diretta degli articoli, e ha avviato accordi di licenza con alcuni editori. Tra questi ci sono News Corp (editrice del Wall Street Journal), Condé Nast (proprietaria del New Yorker) e Dotdash Meredith, che ha dichiarato ricavi annui pari a 16 milioni di dollari derivanti dall’intesa. Il New York Times, invece, ha scelto la via legale e ha già sostenuto 10,8 milioni di dollari in spese processuali nel solo 2024. Secondo la normativa vigente, ogni violazione riconosciuta del copyright potrebbe costare fino a 150 mila dollari per articolo.