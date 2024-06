In attesa di aggiungere nuove voci al chatbot omonimo, Google ha annunciato la disponibilità del modello Gemini 1.5 Pro nella versione aggiornata con una finestra di contesto da 2M di token.

All’I/O 2024, Google ha annunciato una finestra di contesto da 2 milioni di token per Gemini 1.5 Pro. Può elaborare 2 ore di video, 22 ore di audio, oltre 60.000 righe di codice e oltre 1,4 milioni di parole. (Gemini Advanced con 1.5 Pro ne offre oggi la metà). Dopo un’anteprima privata, tutti gli sviluppatori possono ora trarne vantaggio.

2M di token sono una finestra di contesto enorme per Google Gemini 1.5 Pro

L’elaborazione di soli sei minuti di video richiede oltre 100.000 token e basi di codice di grandi dimensioni possono superare 1 milione di token, quindi sia che il caso d’uso implichi la ricerca di bug su innumerevoli righe di codice, l’individuazione delle informazioni giuste nelle librerie di ricerca o l’analisi di ore di audio o video è fondamentale. La finestra contestuale ampliata di Gemini 1.5 Pro aiuta le organizzazioni a esplorare nuovi orizzonti e a far si che l’uso dell’IA generativa abbia “una memoria” molto più ampia rispetto a prima, consentendo interazioni dirette più durature nel tempo.

Gemini 1.5 Pro è già utilizzato da un rivenditore di fast food, un istituto finanziario, un assicuratore e persino una “società sportiva” per analizzare lo swing di un giocatore.

Inoltre, Gemini 1.5 Flash sta entrando nella disponibilità generale. Presenta una finestra di contesto da 1 milione di token, bassa latenza e “prezzi competitivi”. I casi d’uso ideali includono agenti di chat al dettaglio, elaborazione di documenti e “agenti di ricerca in grado di sintetizzare interi repository”.

Gemma 2 rilasciato ufficialmente, Imagen 3 in anteprima

Quello relativo a Gemini 1.5 Pro non è il solo annuncio legato all’IA di Google in queste ore. Gemma 2, il modello LLM open source di Google, è ora disponibile a livello globale in 9B e 27B di dimensioni di parametri (anche con Ollama e OpenWebUI).

Nel frattempo, Imagen 3 verrà lanciato in anteprima (per i clienti Vertex AI con accesso anticipato). Rispetto ad Imagen 2 offre:

“Generazione più veloce di oltre il 40% per prototipazione e iterazione rapide”

“migliore comprensione e tempestività nel seguire le istruzioni”

“generazioni fotorealistiche di gruppi di persone”

“maggiore controllo sul rendering del testo all’interno di un’immagine”