Avec DeepSeek-V3, la Chine a peut-être de quoi inquiéter OpenAI et les grands groupes américains. Son approche open source, dans un secteur de plus en plus dominé par des groupes privés, lui permet d’avancer rapidement, pour beaucoup moins d’argent.
En quelques années seulement, la Chine s’est imposée comme le pays leader en matière d’innovation technologique. Longtemps associé à une image d’assembleur et/ou de copieur, le pays de Huawei et Xiaomi est aujourd’hui celui qui investit le plus dans la recherche, avec l’espoir de détrôner les Etats-Unis. Outre les smartphones et les ordinateurs, la Chine est désormais capable de concevoir ses propres puces et est récemment devenue leader dans le secteur automobile.
Devant l’intelligence artificielle générative grâce à des sociétés comme OpenAI, Google et Meta, les États-Unis ont longtemps pensé qu’ils conserveraient leur avance suffisamment longtemps pour tenir la Chine à distance. Deux ans après l’annonce de ChatGPT, la Chine affirme pourtant les avoir détrônés.
DeepSeek : l’usine modèle chinoise
Fondée en 2023, DeepSeek évolue rapidement. En moins d’un an, elle a réussi à mettre en ligne plusieurs modèles jugés efficaces, notamment grâce à un effort de financement très important de la part des acteurs chinois. DeepSeek fonctionne à la fois sur des LLM classiques (comme GPT-4o), des LLM formés pour des tâches (codage par exemple) et des modèles de pointe, capables de « penser » (comme o1 ou o3).
Son dernier exploit s’appelle DeepSeek-V3 et a été annoncé le 26 décembre 2024. Au programme de ce nouveau modèle :
- Une interface 100% inspirée de celle de ChatGPT, avec des animations très similaires. Il existe même un bouton Rechercher, avec un moteur de recherche intégré.
- Une vitesse d’écriture nettement croissante (60 jetons/mots par seconde).
- Un modèle entièrement open source, avec 671 milliards de paramètres (c’est plus que Meta Llama 3.1, le meilleur modèle open source américain).
- Un coût de formation estimé à 5,5 millions de dollars, que certains estiment 10 fois inférieur à celui des Américains, avec 14,8 billions de tokens analysés pour la formation.
- Une API nettement moins chère, qui pourrait inciter de nombreux développeurs à utiliser DeepSeek, si elle est vraiment efficace, plutôt que GPT-4o ou une autre solution américaine.
Selon les benchmarks publiés par DeepSeek, son modèle V3 est comparable à GPT-4o (OpenAI) et Claude-3.5-Sonnet (Anthropic), les deux LLM les plus populaires aux États-Unis. DeepSeek-V3 fait encore mieux en mathématiques et en codage, tout en excellant naturellement en chinois. Tout cela reste à prouver (les premiers testeurs indiquent que DeepSeek semble parfois confondre), mais c’est néanmoins très prometteur. Surtout pour un prix aussi bas.
Les États-Unis devraient-ils s’inquiéter de DeepSeek-V3 ?
En quelques mois et avec relativement peu d’argent, les ingénieurs recrutés par la Chine auraient donc réussi à égaler GPT-4o, le modèle par défaut de ChatGPT. Il reste bien sûr de nombreux avantages à OpenAI (multimodalité, mode vocal, intégration, génération d’images et de vidéos, etc.), mais la prouesse reste impressionnante. DeepSeek réussit d’autant plus son coup de communication que sa dernière annonce fait réagir aux Etats-Unis, où les précédentes n’intéressaient qu’un public très averti. Le patron de Perplexity s’étonne même de la politique américaine contre l’open source, qui ralentirait les chercheurs. Bref, les États-Unis ont mordu à l’hameçon et s’inquiètent de la montée en puissance chinoise.
Autre point fort : DeepSeek-V3 est déjà disponible gratuitement. Tout le monde peut l’essayer.
Outre les exploits de DeepSeek, qui se veut le ChatGPT chinois, la Chine finance d’autres modèles de pointe. Parmi eux, CogVideoX, HunyuanVideo (Tencent) et Kling pour générer des vidéos ou encore Qwen chez Alibaba. Ils ont tous un point commun : l’open source. Une approche différente des Etats-Unis, qui permet aux chercheurs d’aller plus vite, avec beaucoup plus de données.
Seule inconnue : comment vont réagir les Etats-Unis de Donald Trump, qui connaissent bien cette concurrence chinoise ? Une guerre technologique comme avec Huawei n’est pas impossible, pour ralentir la recherche chinoise.