Google Mariner : qu’est-ce que cet « agent » d’IA qui surfe le web à votre place exactement ?

 
Dans un déluge d’annonce censé concurrencer les actualités autour de ChatGPT, Google a annoncé le lancement de son projet « Mariner » qui permet à une IA de prendre le contrôle de votre ordinateur.
Une capture d’écran du projet « Mariner » de Google // Crédit : Google

L’intelligence artificielle générative sort de son carcan. Longtemps cantonné à une simple interface de discussion, l’IA veut prouver qu’elle a plus d’un tour dans son sac. La dernière nouveauté imaginée par la Silicon Valley s’appelle donc un « agent » et consiste en un petit programme qui va surfer sur le web à votre place pour accomplir les tâches les plus bêtement répétitives. « Mariner » fait partie de cette nouvelle classe d’IA.

Dévoilé par Google le 11 décembre 2024, en même temps qu’une flopée d’autres nouveautés centrée autour de Gemini 2.0, Mariner se pose comme un « changement fondamental de paradigme dans l’approche de l’interface utilisateur », affirme Google à Techcrunch dans un élan de modestie.

C’est quoi Mariner ?

Concrètement, Mariner prend pour le moment la forme d’une extension Chrome. Après avoir indiqué à « l’agent » ce que vous voulez lui faire faire, la machine se met alors au travail et prend le contrôle de la souris et du clavier pour accomplir sa tâche. Dans l’exemple présenté à Techcrunch, Mariner a été capable de faire des courses (avec une liste prédéterminée) et de remplir un panier tout seul depuis le site Internet d’un supermarché.

Cependant, aussi impressionnant que soit le concept sur papier, l’agent de Google souffre d’évidentes limitations dans son état actuel. Tout d’abord, il est lent puisque chaque mouvement de souris lui prend environ 5 secondes, explique Techcrunch. Deuxièmement, Mariner ne peut agir que sur l’onglet Chrome actif. Cela signifie que vous ne pouvez pas faire autre chose pendant que l’IA de Google fait son affaire, vous êtes condamné à la regarder bouger lentement son curseur. Et enfin, il faut encore lui tenir la main pour lui préciser certaines informations lorsqu’elle a un doute.

À noter que la démo est accélérée pour mieux montrer les capacités de Mariner

Évidemment que tous ces inconvénients sont à attendre d’un projet en phase de rodage et uniquement accessible sur invitation. Mais Mariner a aussi tout simplement des contraintes techniques inévitables puisque, pour savoir où cliquer, l’extension prend une capture d’écran de la fenêtre, l’envoi ensuite à Google qui analyse l’image via Gemini 2.0 et renvoi enfin les instructions à la machine exécutant le logiciel. Multipliez ces allers-retours par le temps de la session de surf et vous obtenez automatiquement un logiciel un peu long à la détente (en plus d’être potentiellement un cauchemar pour la vie privée).

Une solution à la recherche d’un problème ?

Mariner, comme le monde entier des agents d’IA, en est au tout début de son existence et s’améliorera sans doute dans les mois et années à venir. Et si Google a effectivement la puissance de frappe suffisante pour faire changer nos habitudes de navigation avec son petit programme, il faut tout de même noter que la firme n’est pas la première à montrer son « agent ». La société Anthropic faisait les mêmes promesses il y a quelques semaines avec Claude 3.5 et que ChatGPT prépare la même chose pour 2025.

Pour aller plus loin
Gemini : tout savoir sur l’IA de Google qui veut remplacer ChatGPT

Reste à savoir tout de même si ces outils répondent vraiment à un problème ou sont plus des démonstrations techniques destinées à montrer que l’intelligence artificielle générative n’est pas en train de faire du sur place, comme certains l’affirment.


Des invités passionnants et des sujets palpitants ! Notre émission UNLOCK est à retrouver un jeudi sur deux en direct, de 17 à 19h sur Twitch. Pensez aussi aux rediffusions sur YouTube !