Anthropic a lancé de nouvelles versions que Claude 3.5 Sonnet et Claude 3.5 Haiku, toujours plus intelligentes que les modèles précédents. L’entreprise annonce toujours des performances bien supérieures aux modèles GPT d’OpenAI. Mais la nouveauté est surtout une fonctionnalité pour l’instant en bêta qui permet à Sonnet de contrôler votre ordinateur à votre place.
C’est donc une évolution significative dans l’univers des « agents IA », ces assistants numériques conçus pour utiliser des logiciels comme le ferait un humain. Contrairement à d’autres solutions comme Devin de Cognition AI, qui se concentre uniquement sur la programmation, Claude se positionne comme un généraliste polyvalent.
L’IA Claude peut utiliser votre ordinateur comme un humain
Les capacités de Claude sont pour le moins impressionnantes : l’IA peut naviguer sur le web, utiliser n’importe quelle application installée, et même manipuler votre ordinateur via des clics de souris et des frappes au clavier. Lors d’une démonstration, l’IA a planifié une excursion pour voir le Golden Gate Bridge au lever du soleil, recherchant un point de vue optimal et ajoutant l’événement au calendrier. Dans un autre exemple, elle a créé un site web simple en utilisant Visual Studio Code, corrigeant même ses propres erreurs lorsqu’on le lui demandait.
Cependant, cette technologie prometteuse n’est pas sans défauts. Selon TechCrunch, Claude 3.5 Sonnet n’a réussi à compléter que moins de la moitié des tâches lors d’un test simple de réservation et de modification de vols. On est sans surprise aussi face à des questions de sécurité évidentes : qui voudrait confier ses fichiers personnels et sa navigation web à une technologie encore expérimentale ?
Anthropic justifie cette approche par une volonté d’amélioration progressive : « Il est préférable de donner accès aux ordinateurs aux modèles actuels, plus limités et relativement plus sûrs. Cela nous permet d’observer et d’apprendre des problèmes potentiels à ce niveau inférieur, tout en développant graduellement les capacités et les mesures de sécurité ».
La fonction « computer use » est aujourd’hui disponible en version bêta publique via l’API d’Anthropic, permettant aux développeurs d’explorer ces nouvelles possibilités. L’entreprise reconnaît le caractère expérimental de cette fonctionnalité, précisant qu’elle peut être « maladroite et sujette aux erreurs », mais s’attend à des améliorations rapides basées sur les retours des utilisateurs.
Utilisez-vous Google News (Actualités en France) ? Vous pouvez suivre vos médias favoris. Suivez Frandroid sur Google News (et Numerama).
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix