Même si les principales sociétés d’intelligence artificielle sont situées aux États-Unis et en Europe, la Chine rattrape rapidement son retard. vitessevitesse. La société chinoise DeepSeek se fait de plus en plus remarquer pour ses grands modèles de langage publiés sous licence libre et capables de concurrencer ceux d’OpenAI.
Après DeepSeek-V2.5 sorti en septembre qui battait GPT-4GPT-4et DeepSeek Coder V2 dévoilé en juin qui bat GPT-4 Turbo pour les mathématiques et la programmation, voici DeepSeek R1-Lite-Preview. C’est un premier aperçu de ce nouveau modèle qui, comme OpenAI o1, est spécialisé dans le raisonnement complexe. Et selon DeepSeek, il parvient à battre le modèle d’OpenAI sur plusieurs benchmarks.
Un modèle de raisonnement complexe qui explique sa pensée
Ce modèle a la particularité d’expliquer sa chaîne de pensée (CoT), permettant de suivre les différentes étapes de son raisonnement. Et il prend son temps. Le chatbot indique le temps passé à réfléchir, qui est souvent d’une trentaine de secondes. Selon les tests effectués par DeepSeek, son R1-Lite-Preview est particulièrement efficace pour les inférences logiques, le raisonnement mathématique et la résolution de problèmes en temps réel. Il obtient même de meilleurs résultats qu’OpenAI o1 sur les tests mathématiques AIME et MATH, et des scores très similaires pour la programmation, notamment Codeforces et LiveCodeBench.
DeepSeek n’a pas encore partagé le code et les poids de son nouveau modèle, mais il est possible de l’essayer gratuitement sur son site chat.deepseek.com, avec une limite de 50 messages par jour. Toutefois, la société a indiqué surGazouillementGazouillement) que le modèle etAPIAPI devrait arriver bientôt.
Related News :