Hier, la firme de Mountain View a présenté ses dernières avancées en matière d’IA. Plus puissant, plus polyvalent et plus complet que Gemini 1.5, Gemini 2.0 est surtout multimodal, c’est-à-dire qu’il peut travailler à la fois avec du texte, du son et des images, et ce, en toute fluidité. Avec de telles possibilités, Google cherche de bonnes raisons pour rendre son nouveau-né utile, et jusqu’à présent, il semble avoir trouvé de bonnes idées.
Dans son billet de blog présentant Gemini 2.0, Google a dévoilé un certain nombre de projets d’agents en cours de développement. Parmi eux, il en est un qui n’a pas encore de nom, mais qui n’en est pas moins intéressant et qui a trait aux jeux vidéo. L’entreprise de Mountain View souhaite, en effet, nous permettre de convoquer son IA pour nous assister lors de nos parties endiablées sur smartphone.
Il serait possible de lui poser des questions sur les stratégies à suivre, de lui demander de se souvenir des détails d’une quête, ou encore de nous en apprendre plus sur les mécanismes du jeu concerné. Gemini irait chercher ses informations sur Google, et se servirait de ce qui se passe à l’écran et de ses échanges avec l’utilisateur pour donner une réponse appropriée.
Bien sûr, tout cela se ferait en temps réel et vocalement, comme s’il s’agissait d’une discussion avec un autre joueur. Cependant, les limites de Gemini 2.0 dans ce contexte ne sont pas encore claires, et Google teste encore les capacités de son IA à « interpréter les règles et les défis » dans des jeux tels que Clash of Clans ou Hay Day.
Est-ce vraiment utile ?
Google n’aurait pas pu trouver meilleur exemple pour illustrer les compétences multimodales de Gemini 2 (à part le projet Astra, bien sûr). Interpréter ce qui se passe dans le champ de vision de l’utilisateur, aller chercher des informations dans une grande base de données, converser de manière naturelle, comprendre des mécaniques de jeu… Ce sont des prérogatives qui, individuellement, sont déjà complexes, mais qui, combinées, peuvent rendre l’IA très puissante.
Je ne partage pas vraiment l’avis de nos confrères de The Verge sur le sujet. À leur question « Ai-je vraiment besoin d’un agent d’IA pour me rappeler les quêtes ? », je répondrais « Oui ». Nous sommes tous parfois confrontés à des moments de friction dans les jeux vidéo, où certains d’entre nous doivent chercher de l’aide auprès d’autres joueurs sur internet.
Si Gemini est capable de réduire ce temps de recherche tout en nous permettant de rester dans le jeu, alors je considère que c’est un succès. Imaginez que vous soyez coincé dans un donjon froid et sombre de Baldur’s Gate 3 pendant plusieurs minutes, sans savoir où aller. Ne serait-ce pas génial de simplement dire « Hey Google, je suis bloqué, comment continuer ma quête ? » et de pouvoir enfin progresser à nouveau ?
Une nouvelle ère qui ne mettra pas tout le monde d’accord
Bien sûr, ce point de vue ne fera pas l’unanimité. D’abord, il y aura ceux qui défendent l’intérêt d’être autonome dans les jeux vidéo, pour ne pas gâcher l’expérience en allant immédiatement chercher une solution sur Google.
Ensuite, il y a la question de la valorisation des sites web qui partagent ce type d’informations. Comme les éditeurs de wiki, les hébergeurs de forums, et surtout les médias qui publient des articles sur ce genre de sujets.
Pour aller plus loin
« Le monde n’est pas prêt » : un ancien employé d’OpenAI alerte sur les dangers de l’intelligence artificielle
Enfin, l’IA n’est pas exempte d’erreurs, et il est peu probable que Gemini 2.0 éradique ce problème. Un tel outil aurait le potentiel de provoquer des frictions d’un nouveau genre, en poussant par exemple les joueurs à choisir la mauvaise équipe pour le prochain combat de Gigamax sur Pokemon GO (voilà, vous connaissez mes deux lubies vidéoludiques coupables du moment).
Ces deux dernières lacunes comptent parmi les plus importantes de Gemini et des solutions concurrentes, et il semble qu’il faille s’en accommoder pour l’instant. Cependant, cet exemple avec les jeux vidéo montre clairement où Google veut amener sa technologie, pour le meilleur et pour le pire. Je pense y voir un réel intérêt à se servir de ces IA, qui pourraient enfin devenir « utiles » au quotidien. Un mot que même le PDG de Google, Sundar Pichai, s’est permis d’utiliser lors de la présentation de Gemini 2.0.
Rejoignez-nous de 17 à 19h, un jeudi sur deux, pour l’émission UNLOCK produite par Frandroid et Numerama ! Actus tech, interviews, astuces et analyses… On se retrouve en direct sur Twitch ou en rediffusion sur YouTube !
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
GĂ©rer mes choix