L’intelligence artificielle connaît une transformation majeure avec l’arrivée d’un nouvel acteur qui défie les géants du secteur : DeepSeek. Cette start-up chinoise, fondée en 2023 à Hangzhou, dirigée par Liang Wenfeng, ne cesse de faire parler d’elle avec son modèle de langage avancé, DeepSeek-R1. Lancé en janvier 2025, ce modèle promet des performances exceptionnelles et une accessibilité accrue grâce à son approche open source. Son essor rapide met une pression considérable sur les leaders du secteur et transforme profondément le marché. Plongeons dans cette évolution majeure pour comprendre son impact sur l’industrie et les changements qu’elle entraîne.
DeepSeek-R1 : un modèle innovant et performant
Après avoir attiré l’attention en décembre dernier avec l’annonce de DeepSeek-V3, son modèle open source, la start-up chinoise DeepSeek a de nouveau bouleversé le marché de l’IA avec le lancement de DeepSeek-R1 le 20 janvier 2025. En quelques jours seulement, il a détrôné ChatGPT en nombre de téléchargements sur l’App Store tant en Chine qu’aux États-Unis. Ce modèle, doté de capacités de raisonnement avancées et entièrement open source, alimente désormais son agent conversationnel. Contrairement aux leaders du secteur comme OpenAI et Google, DeepSeek a réussi à développer son modèle pour un budget inférieur à 6 millions de dollars, soit une fraction des coûts engagés par ses concurrents. Cette prouesse repose sur une optimisation avancée des ressources et une approche innovante du deep learning. DeepSeek-R1 excelle en mathématiques, en programmation et en inférence linguistique , offrant des performances remarquables à moindre coût. Il faut également savoir que DeepSeek a adopté une approche open-source contrairement à OpenAI et Google limitant l’accès à leurs modèles. En mettant son IA à disposition de la communauté, l’entreprise favorise la recherche et l’innovation à l’échelle mondiale.
L’arrivée de DeepSeek-R1 a provoqué une onde de choc sur les marchés financiers. Le 27 janvier 2025, son succès fulgurant a fait chuter les actions de grandes entreprises comme Nvidia, alors leader en bourse. En une seule journée, la capitalisation boursière de Nvidia a chuté de 580 milliards de dollars, marquant la plus grande perte de valeur de l’histoire boursière. Cette dégringolade a relégué Nvidia à la troisième place du marché, derrière Apple et Microsoft. Cette baisse significative traduit les inquiétudes des investisseurs face à la montée en puissance de DeepSeek et à son potentiel de bouleverser le marché de l’intelligence artificielle. Ce bouleversement confirme que la course à l’IA ne se joue plus uniquement aux États-Unis.
DeepSeek-R1-Zero et DeepSeek-R1 sont les premiers modèles de raisonnement développés par DeepSeek. DeepSeek-R1-Zero , conçu à l’aide de l’apprentissage par renforcement (RL) sans réglage fin supervisé (SFT), a démontré de bonnes performances. Cependant, il souffre de certaines limitations, notamment des répétitions excessives et un manque de clarté dans les réponses. Pour surmonter ces problèmes, DeepSeek-R1 a été amélioré en intégrant des données de démarrage à froid avant l’application du RL. Grâce à ces améliorations, il atteint des performances comparables à celles d’OpenAI-o1, notamment dans les domaines des mathématiques, de la programmation et du raisonnement logique.
À l’image de DALL·E pour OpenAI, DeepSeek a développé Janus, son propre modèle de génération d’images à partir de texte. Conçu pour rivaliser avec les meilleures solutions du marché, Janus, et sa version améliorée Janus-Pro, affichent des performances remarquables en compréhension multimodale et en création visuelle, surpassant certains modèles concurrents sur des benchmarks clés.
DeepSeek a subi récemment une cyberattaque majeure, impliquant des botnets comme HailBot et RapperBot, menant à des vagues d’assauts intensifiées. En réponse, l’entreprise a temporairement restreint les inscriptions et alerté sur des comptes frauduleux usurpant son identité. Par ailleurs, une base de données exposée contenant plus d’un million d’enregistrements, dont des historiques de discussions et des clés secrètes, a été découverte par des chercheurs en sécurité. DeepSeek a rapidement sécurisé cette faille après notification.
Conclusion
L’ascension de DeepSeek marque un tournant dans l’évolution de l’intelligence artificielle. Avec DeepSeek-R1, la start-up chinoise démontre qu’il est possible d’allier innovation, accessibilité et performances avancées, tout en proposant une alternative open source. Son impact dépasse le cadre technologique : il influence la dynamique concurrentielle du secteur, accélère la recherche et oblige les acteurs historiques à revoir leurs stratégies. Cette montée en puissance annonce une nouvelle ère où la diversité des approches redéfinit les standards de l’IA à l’échelle mondiale.