Le modèle d’IA générative chinois embarque de nombreux atouts susceptibles de faire de l’ombre aux meilleurs actuellement disponibles sur le marché.
« Quand la Chine s’éveillera, le monde tremblera« . Cette déclaration apocryphe de Napoléon Bonaparte à propos de l’Empire du Milieu s’applique particulièrement dans le contexte de la course à l’intelligence artificielle (IA). Le géant d’Asie vient en effet de donner un aperçu de ses capacités dans le secteur.
Le pays a lancé il y a quelques jours seulement, DeepSeek-V3, un modèle d’IA générative qui intègre de nombreuses innovations majeures, aussi bien par ses performances que par son approche plutôt différente de celle de ses pairs actuellement, notamment américains, sur le marché.
Le coût de son développement estimé à cinq millions de dollars pour une quantité colossale de 14,8 trillions de tokens (unités de texte) analysés, intègre un bon rapport qualité-prix. Il s’agit selon le site d’information spécialisé tech Numérama, d’un investissement dix fois inférieur à celui des modèles américains comparables.
Une stratégique gagnante ?
Cette différence majeure de coût s’explique notamment par l’approche open source adoptée par DeepSeek, l’entreprise à l’origine de ce nouvel outil. Cela permet d’optimiser les ressources et de mutualiser les efforts de développement.
Ce choix tranche avec celui adopté par les firmes américaines, dont OpenAI, qui optent pour le secret, sans doute dans le but de protéger leurs avantages commerciaux. Une stratégie à multiples enjeux. De quoi potentiellement ralentir l’innovation et augmenter les coûts de développement.
« La Chine a développé et entraîné un modèle appelé DeepSeek-v3 qui surpasse le GPT-4o d’OpenAI, avec une fraction du budget habituel, et l’a rendu open source. Pendant ce temps, aux États-Unis, un projet de loi bipartisan est en préparation pour imposer de sévères restrictions sur l’open source des modèles d’IA les plus avancés« , a réagi Aravind Srinivas, patron de Perplexity, un des plus célèbres modèles du marché.
Un motif d’alerte pour les USA
Les benchmarks dévoilés témoignent de la puissance de DeepSeek-V3. Il atteint ainsi une note de 88,5%, dépassant légèrement Claude-3.5-Sonnet (88,3%) et GPT-4 (87,2%), sur le test MMLU, qui évalue la compréhension de multiples domaines.
Sur le test DROP relatif à la compréhension approfondie des textes, DeepSeek-V3 obtient un score de 91,6%, surpassant significativement ses concurrents. En mathématiques, l’IA s’illustre avec un score de 90,2%, devant ses rivaux qui plafonnent autour de 75%.
Des statistiques jugées impressionnantes par des spécialistes américains interrogés par le Wall Street Journal sur la question. Cette prouesse est révélatrice d’après le journal, des stratégies de contournement développées par les acteurs chinois de la tech, face aux difficultés d’accès aux puces américaines dues aux sanctions de Washington.
Une approche déjà éprouvée avec Huawei, dont les smartphones rivalisent mènent la danse face à ses concurrents américains. « Le ‘Made in China’ deviendra une réalité pour les modèles d’IA, tout comme c’est le cas pour les voitures électriques, les drones et d’autres technologies », prophétise Jack Clark, cofondateur de la startup d’IA Anthropic.