Voici Gemma 3 par Google : une IA open source, puissante, qui fonctionne sur smartphone et met DeepSeek au défi

 
Ce n’est pas Gemini dont on va parler cette fois-ci… Avec Gemma 3, Google mise sur des modèles d’IA accessibles et puissants pour concurrencer DeepSeek.

Avant de vous parler de Gemma 3… Revenons un peu en arrière : il y a un an, Google lançait les premiers modèles Gemma, des versions open source (donc accessibles à tous) basées sur Gemini, son IA maison. Le but de Gemma ? Donner un aperçu des talents de Gemini sans révéler ses secrets bien gardés.

Avec 2 et 7 milliards de paramètres – des unités de calcul qui déterminent la « puissance » d’un modèle – ils étaient déjà costauds, mais demandaient des ordinateurs musclés ou le cloud de Google pour tourner correctement. Pas très pratique pour le commun des mortels.

Puis, Google a présenté Gemma 2 en août 2024, un modèle de langage comprenant 2 milliards de paramètres. 

Avec Gemma 3, Google va plus loin. Cette fois, il y a quatre modèles, allant de 1 à 27 milliards de paramètres. Les plus gros (4, 12 et 27 milliards) sont taillés pour des tâches complexes : ils peuvent « lire » jusqu’à 128 000 tokens. Ils savent aussi analyser des images ou des petites vidéos grâce à un encodeur visuel, un outil avec 417 millions de paramètres qui leur donne des yeux numériques.

Mais le plus intéressant, c’est le petit modèle à 1 milliard de paramètres, Gemma3-1B. Moins gourmand, il tourne carrément sur votre smartphone, avec une limite de 32 000 tokens et sans vision. Parfait pour des usages simples et mobiles.

Un article de blog de Google détaille ces approches, et un autre article décrit les techniques utilisées pour optimiser la plus petite version, le modèle à 1 milliard, pour les appareils mobiles. Il s’agit notamment de quatre techniques courantes d’ingénierie de l’IA : la quantification, la mise à jour des dispositions de cache « clé-valeur », l’amélioration du temps de chargement de certaines variables et le « partage du poids GPU ».

Et du côté des performances ?

Côté puissance, Gemma 3 est capable de tout. Le modèle à 4 milliards de paramètres rivalise avec l’ancien Gemma2-27B, tandis que le grand frère, Gemma3-27B, se mesure à Gemini-1.5, un poids lourd de l’IA.

Ce qui est cool, c’est leur polyvalence : on peut les transformer en « agents » – des sortes de petits assistants virtuels qui agissent pour vous – ou les personnaliser pour des langues ou des besoins spécifiques. Google a même créé le « Gemmaverse« , une plateforme avec des exemples pour inspirer les développeurs.

Et face à DeepSeek, un concurrent sérieux dans le monde de l’IA ? Google sort l’artillerie : Gemma3-27B, par exemple, demande une seule carte Nvidia H1000 pour fonctionner, alors que DeepSeek R1 ou V3 en exigent 32 pour des résultats similaires. Vous l’aurez compris, Google propose une IA aussi puissante, mais beaucoup moins gourmande en ressources.

Gemma 3 est généralement moins précis que Gemini 1.5 et Gemini 2.0, mais malgré tout, Gemma 3 « affiche des performances compétitives par rapport aux modèles Gemini fermés ».

Pourquoi ça compte pour vous ?

Vous vous demandez peut-être : « OK, mais moi, qu’est-ce que j’y gagne ?« . Pour le moment, rien. Mais ces modèles sont ouverts, cela veut dire que n’importe quel développeur peut les prendre, les bidouiller et créer des fonctions utiles : une applcationi qui traduit en temps réel, un assistant qui rédige vos mails, ou même un outil qui vérifie les images pour respecter des règles précises grâce à ShieldGemma 2, intégré aux gros modèles.

Google pousse aussi l’adoption en offrant des crédits sur sa plateforme de calcul. Que vous soyez un pro de la tech ou juste curieux, Gemma 3 pourrait bien rendre l’IA plus accessible, même sur votre vieux smartphone.


Téléchargez notre application Android et iOS ! Vous pourrez y lire nos articles, dossiers, et regarder nos dernières vidéos YouTube.