Bien que les principales sociétés d’IA soient situées aux États-Unis et en Europe, la Chine rattrape rapidement son retard. vitessevitesse. La société chinoise DeepSeek se fait de plus en plus remarquer pour ses grands modèles de langage publiés sous licence libre et capables de concurrencer ceux d’OpenAI.
Après la sortie de DeepSeek-V2.5 en septembre, ce battement GPT-4GPT-4et DeepSeek Coder V2 présenté en juin qui bat GPT-4 Turbo pour les mathématiques et la programmation, voici DeepSeek R1-Lite-Preview. C’est un premier avant-goût de ce nouveau modèle qui, comme OpenAI o1, est spécialisé dans le raisonnement complexe. Et selon DeepSeek, il parvient à battre le modèle OpenAI sur plusieurs benchmarks.
Un modèle de raisonnement complexe qui explique sa pensée
Ce modèle a la particularité d’expliquer sa chaîne de pensée (CoT), permettant de suivre les différentes phases de son raisonnement. Et il prend son temps. Le chatbot indique le temps passé à réfléchir, qui est souvent d’une trentaine de secondes. Selon les tests effectués par DeepSeek, son R1-Lite-Preview est particulièrement efficace pour les inférences logiques, le raisonnement mathématique et la résolution de problèmes en temps réel. Il obtient même de meilleurs résultats qu’OpenAI o1 dans les tests mathématiques AIME et MATH, et des scores très similaires pour la programmation, notamment Codeforces et LiveCodeBench.
DeepSeek n’a pas encore partagé le code et les pondérations de son nouveau modèle, mais vous pouvez l’essayer gratuitement sur son site chat.deepseek.com, avec une limite de 50 messages par jour. Toutefois, l’entreprise a indiqué queGazouillementGazouillement) que le modèle estAPIAPI devrait arriver bientôt.