● BFM Tech
📅 24/04/2026 à 10:13
"Bienvenue dans l'ère du contexte d'un million de caractères à moindre coût": le nouveau modèle d’IA de Deepseek n’est qu’à 3 ou 6 mois d’égaler les meilleurs modèles occidentaux
Géopolitique
L'entreprise chinoise, qui avait bouleversé la Silicon Valley début 2025 en lançant une IA du même nom, a annoncé un nouveau modèle, Deepseek-V4. Attendu de longue date, il est notamment capable de mémoriser et comprendre un million de caractères d'un coup. Une capacité généralement gourmande en calculs, mais qui aurait coûté moins cher à la start-up.L'un des plus performants du monde. L'entreprise chinoise Deepseek a annoncé vendredi le lancement très attendu de son nouveau modèle d'IA. "Aujourd'hui, la pré-version de notre toute nouvelle série de modèles, Deepseek-V4, est officiellement mise en ligne et publiée en open source", a indiqué la société dans un communiqué.Une des principales nouveautés réside dans les capacités de traitement. "Deepseek-V4 dispose d'un contexte ultra-long d'un million de caractères", a-t-elle affirmé. Il peut ainsi mémoriser et comprendre un million de caractères d'un coup.Exemple concret: en lui donnant des centaines de pages de texte, l'équivalent de plusieurs romans, il serait capable de répondre à des questions précises sur l'ensemble sans rien oublier entre le début et la fin. Cette capacité est d'ordinaire fortement gourmande en calculs, mais Deepseek assure avoir rendu le procédé plus rapide et moins cher.Les capacités de long contexte du nouveau modèle sont "parmi les meilleures au monde", a assuré l'entreprise. "Bienvenue dans l'ère du contexte d'un million de caractères à moindre coût", a-t-elle aussi souligné sur le réseau social X."Un événement majeur"Ce nouveau modèle est proposé en deux versions: Deepseek-V4-Pro et Deepseek-V4-Flash, cette dernière étant présentée comme plus économique. Il est aussi multimodal, c'est-à-dire capable de générer textes, images et vidéos. Selon des experts du secteur, le nouveau modèle a le potentiel de secouer à nouveau les titres de ses rivaux américains.L'annonce de la start-up marque un tournant décisif en matière d'innovation, juge Zhang Yi, fondateur du cabinet iiMedia. "Cela répond aux problèmes persistants de lenteur des performances et de coûts élevés liés à la taille des longs contextes, et cela marque ainsi un véritable point d'inflexion pour le secteur", dit-il à l'AFP, soulignant les bénéfices potentiels pour les particuliers."Si la prise en charge des contextes ultra-longs devient une fonctionnalité standard, le traitement des longs textes ne devrait plus rester cantonné aux grands laboratoires de recherche, mais entrer dans le quotidien des applications commerciales grand public", prédit-il.L'entreprise avait déjà stupéfié le monde et rebattu les cartes de l'IA en janvier 2025, avec la sortie d'un agent conversationnel rivalisant, à moindre coût selon elle, avec ses concurrents américains Gemini, ChatGPT ou Claude. L'industrie mondiale de la tech guettait ainsi depuis plusieurs semaines l'annonce de vendredi, baromètre des ambitions chinoises dans le secteur.Pour Max Liu, expert reconnu de l'IA, la dernière avancée de Deepseek, présentée quelques heures seulement après le lancement de GPT-5.5 d'OpenAI, représente un "événement majeur". Selon lui, si le nouveau modèle de la start-up chinoise atteint réellement les performances des modèles occidentaux, ce sera "tout aussi fracassant que la sortie initiale de Deepseek" début 2025, indiquait-il.Tout en reconnaissant que Deepseek-V4 fait mieux que GPT-5.2 sur les benchmarks standard, mais n'est pas encore au niveau des dernières moutures des modèles d'OpenAI, Google ou Anthropic. Max Liu avançait, selon Bloomberg, que le nouveau Deepseek est 3 à 6 mois en retard sur le meilleur de la concurrence occidentale seulement. Mais cela ne semble finalement pas tant l'enjeu ici, l'ambition de Deepseek est de réduire les coûts pour faciliter l'extension de l'IA et recruter de nouveaux clients."C'est une bonne nouvelle pour toute l'industrie de l'IA en Chine. Cela permettra de proposer de meilleurs modèles aux utilisateurs chinois, et on peut désormais s'attendre à beaucoup de choses: davantage de produits, un marché plus concurrentiel et un taux d'adoption de l'IA plus élevé", s'est-il réjoui.DeepSeek-V4 peut en outrre fonctionner avec les dernières puces fabriquées par le géant chinois Huawei, a indiqué l'entreprise dans un rapport. Une telle évolution marque une étape importante pour la Chine, qui ne dispose toujours pas des puces haut de gamme du fabricant américain Nvidia, malgré un assouplissement des restrictions à l'exportation par les Etats-Unis.Les plus lus"Opération des jambes", "prothèse"... Mojtaba Khamenei est gravement blessé et aura "éventuellement" besoin de chirurgie esthétique, selon le New York TimesQuel avenir pour Emmanuel Macron après 2027? Le président promet de ne plus faire de politique après la présidentielle400.000 dollars empochés grâce à des informations confidentielles: un militaire américain poursuivi pour des paris sur la chute de Nicolas MaduroContrôle routier, arme blanche… Ce que l'on sait sur l'homme abattu par des policiers municipaux à MarseilleBenzema de retour avec les Bleus si Zidane devient sélectionneur? La réponse du buteur français
🔗 Lire l'article original
👁️ 0 lecture