Olympus, prochaine révolution du géant Amazon ?

 
Amazon souhaiterait franchir une nouvelle étape dans le domaine de l’intelligence artificielle avec le développement d’Olympus, un nouveau modèle d’IA générative capable de traiter simultanément les images, les vidéos et le texte, selon les informations révélées mercredi par The Information.
Cartons Amazon // Source : Unsplash

D’après deux sources proches du dossier, ce grand modèle de langage (LLM) permettrait aux utilisateurs de rechercher des scènes spécifiques dans des vidéos à l’aide de simples requêtes textuelles. Par exemple, il serait possible de localiser instantanément un panier décisif dans un match de basketball ou d’identifier une technique particulière de préparation du café.

Cette innovation marquerait un tournant stratégique pour le géant du e-commerce, qui cherche à réduire sa dépendance vis-à-vis du chatbot Claude d’Anthropic, actuellement très populaire sur Amazon Web Services (AWS).

Paradoxalement, cette annonce intervient peu après qu’Amazon a investi 4 milliards de dollars supplémentaires dans Anthropic, doublant ainsi sa mise initiale de septembre 2023.

Pour aller plus loin
OpenAI Sora : 16 exemples de vidéos créées avec l’IA texte-vidéo

Quand sortirait Olympus, l’IA d’Amazon ?

Selon The Information, Amazon pourrait dévoiler Olympus dès la semaine prochaine lors de la conférence annuelle AWS re:Invent. Cette annonce s’inscrit dans une stratégie plus large visant à contrer l’impression que ses concurrents, Google, Microsoft et OpenAI, ont pris une avance décisive dans le développement de l’IA générative.

La bataille s’annonce particulièrement intense sur le terrain de la génération vidéo, où OpenAI s’est déjà positionné avec son service Sora. L’année 2025 pourrait ainsi être marquée par un duel technologique entre Olympus et Sora, chaque entreprise cherchant à s’imposer dans ce segment prometteur.

Contacté par Reuters, Amazon n’a pas souhaité commenter ces informations. Cette discrétion alimente donc les spéculations sur les capacités réelles d’Olympus et sur la stratégie d’Amazon dans le domaine de l’IA générative. Ce qui est sûr, c’est que le traitement multimodal (texte, image et vidéo) apparaît comme un enjeu majeur pour ces entreprises qui cherchent à proposer des services toujours plus performants et polyvalents.


Utilisez-vous Google News (Actualités en France) ? Vous pouvez suivre vos médias favoris. Suivez Frandroid sur Google News (et Numerama).

Les derniers articles