Google presenta Gemini 3: un’unica AI per testo, immagini e audio. “Ci piace pensare che aiuterà tutti a dare vita a qualsiasi idea”

Google ha presentato Gemini 3, il nuovo modello di intelligenza artificiale progettato per funzionare in tutto il mondo e integrato nei principali servizi dell’azienda, con l’obiettivo di migliorare la ricerca, la produzione di contenuti e la capacità di capire testi, immagini, audio e video. La società ha spiegato che il modello nasce per aiutare utenti, sviluppatori e aziende a usare l’AI in modo più naturale e veloce.

Durante il lancio, i responsabili di Google hanno definito Gemini 3 “il miglior modello al mondo” per creazione e interpretazione dei contenuti, descrivendolo come un sistema capace di trasformare diverse informazioni in un’unica forma di linguaggio digitale. Koray Kavukcuoglu, a capo dell’AI di Google, ha spiegato ai giornalisti: “È il nostro modello più intelligente. Ci piace pensare che aiuterà tutti a dare vita a qualsiasi idea”.

Il nuovo modello sarà disponibile nell’app Gemini, che oggi conta oltre 650 milioni di utenti mensili, e integrato nel motore di ricerca di Google, utilizzato da più di due miliardi di persone ogni mese. La versione più potente, Gemini 3 Pro, è già accessibile agli utenti dell’app e permette di combinare testo, foto e audio come se fossero parte di uno stesso linguaggio. Con questa tecnologia, per esempio, una serie di immagini può diventare un ricettario completo, oppure un video educativo può trasformarsi in schede di ripasso generate in tempo reale.

Nella modalità di ricerca potenziata dall’AI, Gemini 3 Pro offre risultati con immagini, tabelle e simulazioni, basandosi su una versione aggiornata della tecnica chiamata “query fan-out”, progettata per capire meglio l’intento di chi pone la domanda e trovare contenuti che prima non venivano individuati.

Demis Hassabis, amministratore delegato di Google DeepMind, ha spiegato che l’azienda sta inserendo l’AI “ovunque” nei propri prodotti. Ha osservato che il mercato dell’intelligenza artificiale presenta segnali di possibile sopravvalutazione, ma ha aggiunto che Google utilizza già questi sistemi in servizi come Google Maps, Gmail e la ricerca. “Nello scenario peggiore, faremo ancora più affidamento su tutto questo”, ha affermato Hassabis. “In quello migliore, abbiamo il portafoglio più ampio e la ricerca più all’avanguardia”.

Google ha mostrato anche gli strumenti costruiti attorno all’AI, come NotebookLM, che genera podcast partendo da documenti di testo, e AI Studio, che permette di creare versioni preliminari di applicazioni usando comandi semplici. L’azienda sta sperimentando la stessa tecnologia in settori come la robotica e il gaming, ritenuti in grado di offrire sviluppi importanti nei prossimi anni.

Dal 18 novembre Gemini 3 è disponibile nell’app e all’interno di AI Overviews, la funzione che riassume automaticamente le informazioni nella ricerca. Durante le dimostrazioni, Google ha mostrato che il modello può creare grafici per spiegare concetti complessi, come il problema dei tre corpi in fisica, direttamente mentre l’utente formula la richiesta.

Robby Stein, vicepresidente di Google Search, ha spiegato che nell’ultimo anno è cresciuto in modo significativo l’utilizzo delle ricerche in linguaggio naturale e che la ricerca per immagini è aumentata del 70 per cento, grazie alla capacità del modello di analizzare fotografie in modo più accurato.

Negli ultimi mesi, Google ha accelerato i propri investimenti nel settore per recuperare terreno dopo l’arrivo di ChatGPT nel 2022, che aveva portato OpenAI al centro del dibattito sull’AI. Oggi, secondo Bloomberg, Google sarebbe vicina a un accordo con Apple per integrare Gemini in Siri, mentre il nuovo strumento di generazione di immagini Nano Banana sta ottenendo un forte interesse da parte degli utenti. Nel report pubblicato a luglio, Alphabet ha comunicato che AI Overviews ha contribuito a un aumento del 10 per cento delle ricerche effettuate tramite Google.

Nel frattempo, il nuovo modello GPT-5 di OpenAI non ha soddisfatto alcune aspettative del settore, con commenti sul tono ritenuto troppo formale e su prestazioni considerate meno incisive del previsto. Google ha presentato Gemini 3 come un sistema in grado di migliorare i servizi esistenti e di funzionare come base per il prossimo ciclo di innovazioni legate all’AI.

DIGITAL PR E AGENZIE DI COMUNICAZIONE

Google presenta Gemini 3: un’unica AI per testo, immagini e audio. “Ci piace pensare che aiuterà tutti a dare vita a qualsiasi idea”