Un ChatGPT ultra-rapide : Google présente un nouveau LLM basé sur Gemini

Il veut aller très vite

 
Gemini Ă©tait la star de la Google I/O 2024 avec de nombreuses annonces autour du LLM. Parmi elles, l’arrivĂ©e de Gemini 1.5 Flash, la version ultra-rapide du grand modèle de langage. Pourquoi ce LLM et Ă  quoi va-t-il bien servir ?
Le logo de Gemini // Source : Google

C’Ă©tait le sujet du jour : Gemini, avec le plein d’innovations durant la confĂ©rence annuelle de Google, la Google I/O 2024. Gemini s’invite dans Google Photos, sur la recherche Google, et sa version la plus puissante arrive dans Gemini Advanced. En parallèle de toutes ces annonces, il y a aussi une version très rapide du LLM : Gemini 1.5 Flash.

Pour aller plus loin
La Google I/O 2024 résumée en 15 annonces : Gemini 1.5 Pro, Project Astra, AI Overview, Gmail, Andoid 15, Veo, etc.

C’est quoi Gemini 1.5 Flash ?

Google prĂ©sente son Ă©nième version de Gemini, baptisĂ©e Gemini 1.5 Flash. Il s’agit d’un modèle de langage plus lĂ©ger que Gemini 1.5 Pro, « conçu pour ĂŞtre rapide et efficace Ă  grande Ă©chelle », prĂ©cise Google dans son billet de blog. L’idĂ©e n’est pas tant d’en faire un LLM utilisable directement par le grand public, mais un modèle intĂ©grĂ© dans certaines applications (via l’API de Google). Ce LLM est en fait « optimisĂ© pour les tâches Ă  haut volume et Ă  haute frĂ©quence », tout en Ă©tant plus rentable pour les entreprises qui voudraient l’utiliser.

Gemini 1.5 Flash // Source : Google

Pour autant, il est multimodal comme son grand frère Gemini 1.5 Pro, ce qui signifie qu’il peut se baser sur du texte, de l’audio ou encore des images. Et ce y compris sur de grandes quantitĂ©s d’informations. Pour cela, il dispose d’une capacitĂ© de traitement d’un million de tokens (ou jetons), ce qui permet de traiter en une fois une heure de vidĂ©o, onze heures d’audio, 30 000 lignes de code ou 700 000 mots.

Pour aller plus loin
C’est quoi un LLM ? Comment fonctionnent les moteurs de ChatGPT, Gemini et autres ?

Si Gemini 1.5 Flash est moins bon que 1.5 Pro ou 1.0 Ultra, il se montre dans tous les tests avancĂ©s par Google meilleur que Gemini 1.0 Pro prĂ©sentĂ© en dĂ©cembre dernier. Ce qui pose question, c’est que dans sa communication, Google ne mentionne qu’une seconde de latence, sans statistiques avancĂ©es. C’est plutĂ´t Ă©trange pour un LLM qui se veut spĂ©cialisĂ©.

Vous n’utiliserez pas (directement) cette version de Gemini

Google vend son modèle en indiquant que Gemini 1.5 Flash « excelle en matière de rĂ©sumĂ©s, d’applications de chat, de sous-titrage d’images et de vidĂ©os, d’extraction de donnĂ©es Ă  partir de longs documents et tableaux, etc. » Sa vitesse de rĂ©ponse : moins d’une seconde de latence en moyenne dans la grande majoritĂ© des situations, se permet d’avancer Google.

Google Gemini // Source : Frandroid

Gemini 1.5 Flash est pour le moment disponible en test en avant-première publique dans sa version avec 1 million de jetons, uniquement dans Google AI Studio et Vertex AI (sur Google Cloud). L’idĂ©e pour Google est donc avant tout de vendre ce LLM auprès des entreprises et des dĂ©veloppeurs.


Rejoignez-nous de 17 Ă  19h, un jeudi sur deux, pour l’Ă©mission UNLOCK produite par Frandroid et Numerama ! Actus tech, interviews, astuces et analyses… On se retrouve en direct sur Twitch ou en rediffusion sur YouTube !

Les derniers articles