Google poursuit ses travaux dans le domaine de l’intelligence artificielle et vient d’annoncer une nouvelle prouesse de DeepMind. Après avoir battu l’un des meilleurs joueurs mondiaux de Go, celui-ci lirait maintenant mieux sur les lèvres qu’un humain.
5000 heures passées à lire les lèvres
Ce nouvel exploit de DeepMind est rendu possible par les milliers d’heures qu’il a passées à lire sur les lèvres d’humains dans divers programmes de la BBC. Cette énorme ressource lui a permis d’avoir un corpus de 118,000 phrases à analyser. Les chercheurs ont ainsi mis au point une modélisation dénommée « Watch, Listen, Attend and Spell« . Celle-ci permet d’obtenir de meilleurs résultats qu’un interprète humain de haut niveau, et est capable de déchiffrer 46,8 % des mots contre uniquement 12,4 % pour l’interprète humain, dans une vidéo choisie au hasard dans les programmes de la BBC entre 2010 et 2015.
Pour quelles applications ?
Cette montagne de données devrait d’ailleurs être rendue disponible afin que les autres chercheurs du domaine puissent également en profiter. Ces nouvelles capacités pourraient permettre d’améliorer la performance des assistants vocaux, comme celui de Google. Ou bien peut-être qu’il pourrait servir un but plus honorable, et ainsi aider les personnes sourdes et malentendantes dans leur vie quotidienne, par exemple. Si vous vous inquiétez qu’une technologie puisse servir à l’amélioration d’outils de surveillance, un obstacle majeur s’y oppose cependant. En effet, toutes ces scènes sont à la télévision, dans un environnement très bien éclairé, et contrôlé. Lire les lèvres d’un passant dans la rue, surtout de nuit, reste donc, pour le moment, du domaine de l’impossible.
Retrouvez un résumé du meilleur de l’actu tech tous les matins sur WhatsApp, c’est notre nouveau canal de discussion Frandroid que vous pouvez rejoindre dès maintenant !
Si seulement ils pouvaient se cacher pour de bon et ne plus revenir. :(
C'est pour ça qu'on les voit souvent se cacher la bouche quand il se parlent. Je crois que c'est les joueurs de double au tennis qui ont commencé.
Je me suis posé la même question, et une autre sur la qualité. OK, l'ordi reconnaît un mot sur deux, mais lesquels ? Si c'est pour identifier les articles et les pronoms mais pas les verbes, reconstituer le sens d'une phrase s'avère hasardeux. Car c'est au niveau de la phrase et pas du mot qu'est le sens.
C'est qui leur humain de test? Je connais quelques personnes sourdes et d'autres qui pratiquent la lsf depuis des années, ils comprennent bien ce qu'ils lisent sur nos lèvres.
Ça a déjà été dis, redis, et reredis. ^^ Par contre pour savoir ce que se marmonnent nos hommes politiques cela pourrait être drôle.
On va enfin savoir ce que Materazzi et Zidane ont pu se dire avant le coup de boule ? Comment ça, ce n'est pas l'objectif prioritaire de Google ?
Que ce soit une avancée, c'est incontestable. Par contre, pour l'"assistant vocal"... C'est déjà moyen à la voix, alors avant qu'il lise sur les lèvres il va falloir encore bosser.
Pas concerné... Que la Force soit avec vous.
"Si vous vous inquiétez qu’une technologie puisse servir à l’amélioration d’outils de surveillance, un obstacle majeur s’y oppose cependant. En effet, toutes ces scènes sont à la télévision, dans un environnement très bien éclairé, et contrôlé. Lire les lèvres d’un passant dans la rue, surtout de nuit, reste donc, pour le moment, du domaine de l’impossible." C'est valable si on filme avec la caméra d'un smartphone, mais pour un application militaire ou une camera spécialisée, c'est tout à fait faisable, même de nuit.
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix