C’était le sujet du jour : Gemini, avec le plein d’innovations durant la conférence annuelle de Google, la Google I/O 2024. Gemini s’invite dans Google Photos, sur la recherche Google, et sa version la plus puissante arrive dans Gemini Advanced. En parallèle de toutes ces annonces, il y a aussi une version très rapide du LLM : Gemini 1.5 Flash.
Pour aller plus loin
La Google I/O 2024 résumée en 15 annonces : Gemini 1.5 Pro, Project Astra, AI Overview, Gmail, Andoid 15, Veo, etc.
C’est quoi Gemini 1.5 Flash ?
Google présente son énième version de Gemini, baptisée Gemini 1.5 Flash. Il s’agit d’un modèle de langage plus léger que Gemini 1.5 Pro, « conçu pour être rapide et efficace à grande échelle », précise Google dans son billet de blog. L’idée n’est pas tant d’en faire un LLM utilisable directement par le grand public, mais un modèle intégré dans certaines applications (via l’API de Google). Ce LLM est en fait « optimisé pour les tâches à haut volume et à haute fréquence », tout en étant plus rentable pour les entreprises qui voudraient l’utiliser.
Pour autant, il est multimodal comme son grand frère Gemini 1.5 Pro, ce qui signifie qu’il peut se baser sur du texte, de l’audio ou encore des images. Et ce y compris sur de grandes quantités d’informations. Pour cela, il dispose d’une capacité de traitement d’un million de tokens (ou jetons), ce qui permet de traiter en une fois une heure de vidéo, onze heures d’audio, 30 000 lignes de code ou 700 000 mots.
Pour aller plus loin
C’est quoi un LLM ? Comment fonctionnent les moteurs de ChatGPT, Gemini et autres ?
Si Gemini 1.5 Flash est moins bon que 1.5 Pro ou 1.0 Ultra, il se montre dans tous les tests avancés par Google meilleur que Gemini 1.0 Pro présenté en décembre dernier. Ce qui pose question, c’est que dans sa communication, Google ne mentionne qu’une seconde de latence, sans statistiques avancées. C’est plutôt étrange pour un LLM qui se veut spécialisé.
Vous n’utiliserez pas (directement) cette version de Gemini
Google vend son modèle en indiquant que Gemini 1.5 Flash « excelle en matière de résumés, d’applications de chat, de sous-titrage d’images et de vidéos, d’extraction de données à partir de longs documents et tableaux, etc. » Sa vitesse de réponse : moins d’une seconde de latence en moyenne dans la grande majorité des situations, se permet d’avancer Google.
Gemini 1.5 Flash est pour le moment disponible en test en avant-première publique dans sa version avec 1 million de jetons, uniquement dans Google AI Studio et Vertex AI (sur Google Cloud). L’idée pour Google est donc avant tout de vendre ce LLM auprès des entreprises et des développeurs.
Téléchargez notre application Android et iOS ! Vous pourrez y lire nos articles, dossiers, et regarder nos dernières vidéos YouTube.
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix