DeepSeek, une startup basée à Hangzhou fondée en 2023, a rapidement émergé comme un acteur majeur dans le paysage de l'IA, défiant la domination des entreprises américaines établies comme OpenAI et Google. Cet article explore les raisons de la montée soudaine de DeepSeek, son impact sur le marché et les controverses entourant son développement et son déploiement.
La montée soudaine de DeepSeek dans l'industrie de l'IA peut être attribuée à une combinaison de facteurs, suscitant à la fois excitation et controverse. La revendication de l'entreprise de développer des modèles performants pour seulement 6 millions de dollars a suscité intérêt et scepticisme. Certains experts soutiennent que, bien que ce chiffre puisse refléter les coûts de formation, il ne prend pas en compte des dépenses significatives telles que l'acquisition de données et la recherche.
Bien que DeepSeek ait apparemment utilisé des GPU moins puissants disponibles en Chine, son succès est également dû à des techniques avancées de post-formation. Cette rentabilité a cependant alarmé les investisseurs, entraînant une "vente de DeepSeek" et soulevant des inquiétudes quant à la demande future pour des GPU haut de gamme.
De plus, l'approche open-source de DeepSeek et le désir croissant d'alternatives aux fournisseurs d'IA basés aux États-Unis renforcent son attractivité. Cependant, la censure stricte du modèle soulève des préoccupations concernant le contrôle de l'information, tandis que ses faiblesses démontrées en matière de sécurité de l'IA ont attiré l'attention.
En outre, les revendications concernant l'efficacité énergétique supérieure de DeepSeek sont contestées, certaines études suggérant que ses performances dans ce domaine pourraient être exagérées. Enfin, l'émergence de DeepSeek a des implications géopolitiques, déclenchant des discussions sur la compétitivité des États-Unis dans l'IA et les réponses potentielles du gouvernement, y compris d'éventuelles interdictions similaires à celles imposées à d'autres entreprises technologiques chinoises.
DeepSeek a attiré l'attention du monde technologique pour plusieurs raisons :
Liang Wenfeng, le fondateur de 39 ans de DeepSeek, est rapidement devenu une figure éminente dans le paysage technologique chinois, incarnant les aspirations de la nation à surmonter les contrôles d'exportation américains et à atteindre la tête de l'intelligence artificielle. Maintenant qu'il maintenait un profil bas jusqu'à récemment, la présence de Liang à un symposium fermé organisé par le Premier ministre Li Qiang a signalé la reconnaissance par Pékin du potentiel de DeepSeek à remodeler l'ordre mondial de l'IA. Bien que le lancement récent par DeepSeek d'un assistant IA rentable ait attiré l'attention mondiale, la vision de Liang va bien au-delà des applications commerciales. Contrairement à d'autres leaders technologiques chinois qui se sont concentrés sur l'échelle des innovations existantes, Liang a donné la priorité à la recherche et au développement fondamentaux, ciblant spécifiquement la création d'une Intelligence Artificielle Générale (AGI). Cet engagement envers l'originalité, un départ de l'approche traditionnellement imitative de la Chine, reflète la conviction de Liang que l'industrie technologique du pays doit embrasser des percées fondamentales pour véritablement rivaliser sur la scène mondiale. La stratégie open-source de DeepSeek, faisant écho à une pratique précédemment défendue par des initiés technologiques américains, souligne encore l'engagement de Liang à favoriser l'innovation et à construire un "pouvoir doux" au sein de la communauté IA. Son parcours, allant des études académiques à l'Université de Zhejiang à la co-fondation d'un fonds spéculatif quantitatif réussi, démontre un mélange de curiosité intellectuelle et de sens des affaires. Le pivot éventuel du fonds spéculatif vers la recherche en IA, culminant avec la création de DeepSeek, souligne l'engagement de Liang à s'attaquer aux "problèmes les plus difficiles du monde" et à attirer les meilleurs talents partageant son ambition d'atteindre l'AGI. Le parcours de Liang reflète un changement plus large dans l'industrie technologique chinoise, passant de l'imitation à l'innovation originale et à une vision à long terme pour la domination de l'IA.
Source: panewslab
DeepSeek a rapidement émergé comme un concurrent d'OpenAI, bien qu'avec une approche distincte. Alors qu'OpenAI, fondée en 2015, s'est concentrée sur des capacités d'IA larges et une gamme de modèles spécialisés (comme DALL-E et Whisper), DeepSeek, établi en 2023, privilégie des modèles open-source efficaces avec un fort accent sur le raisonnement. Cette différence se reflète dans leurs modèles phares : GPT-4 et o1 d'OpenAI contre V3 et R1 de DeepSeek. L'approche de formation de DeepSeek diverge considérablement de celle d'OpenAI, qui repose sur un ajustement supervisé et basé sur des instructions. DeepSeek exploite l'apprentissage par renforcement, un système d'ingénierie des récompenses sophistiqué, la distillation des connaissances pour la compression des modèles, et un "réseau de comportement émergent" où le raisonnement complexe émerge de manière organique. Ces innovations ont permis à DeepSeek d'atteindre des performances comparables à celles de l'o1 d'OpenAI, en particulier dans les tâches de raisonnement, mais à un coût considérablement inférieur. DeepSeek affirme que son modèle R1 a coûté moins de 6 millions de dollars à développer, un contraste frappant avec les centaines de millions estimées pour l'o1 d'OpenAI. Cet avantage de coût découle en partie des méthodes de formation efficaces de DeepSeek et en partie de son utilisation de matériel moins coûteux. Le développement des modèles de DeepSeek a été rapide, avec une série de sorties depuis sa création. Celles-ci incluent DeepSeek Coder pour les tâches de codage, le DeepSeek LLM à usage général, et des versions de plus en plus puissantes comme DeepSeek-V2 et DeepSeek-Coder-V2. Les modèles phares actuels, DeepSeek-V3 et le DeepSeek-R1 axé sur le raisonnement, affichent tous deux 671 milliards de paramètres et une fenêtre de contexte de 128 000 tokens. DeepSeek s'est également diversifié dans la vision avec Janus-Pro-7B, démontrant son ambition de rivaliser dans divers domaines de l'IA.
Janus et Janus-Pro-7B : Élargir les Capacités de DeepSeek
DeepSeek continue d'élargir son offre avec le lancement de Janus-Pro-7B, un modèle d'IA open-source conçu pour la génération de texte à image. Ce mouvement signale l'ambition de DeepSeek de rivaliser dans plusieurs disciplines de l'IA, défiant encore la domination des acteurs établis.
L'engagement de DeepSeek envers les modèles open-source et son accent sur une formation efficace et des capacités de raisonnement avancées le positionnent comme un perturbateur significatif dans le paysage de l'IA.
Caractéristiques et Applications Clés de DeepSeek
DeepSeek offre une gamme de fonctionnalités et de capacités qui en font un outil d'IA polyvalent pour diverses applications :
L'arrivée de DeepSeek a non seulement perturbé le paysage de l'IA mais a également envoyé des ondes de choc à travers le marché boursier, impactant particulièrement les géants de la technologie. La réaction initiale au lancement de DeepSeek a été une vente dramatique, avec le Nasdaq plongeant et Nvidia subissant une perte record d'environ 600 milliards de dollars en capitalisation boursière en une seule journée. Ce déclin drastique a été alimenté par des inquiétudes concernant le potentiel de DeepSeek à sous-coter les entreprises américaines d'IA avec ses coûts de développement plus bas et ses modèles open-source moins chers. La vente s'est étendue au-delà de Nvidia, impactant les entreprises de semi-conducteurs, d'énergie et d'infrastructure exposées à l'IA, perdant collectivement plus de 1 trillion de dollars en valeur.
Cependant, cette panique initiale s'est apaisée alors que les investisseurs ont réévalué la situation. Les chasseurs de bonnes affaires ont vu une opportunité, entraînant un rebond partiel des actions technologiques. Nvidia a rebondi avec un gain de 8,9 %, tandis que le secteur technologique plus large a augmenté de 3,6 %. Ce rebond suggère que, bien que l'émergence de DeepSeek soit un développement significatif, les investisseurs reconnaissent la demande continue pour des solutions d'IA haute performance, indépendamment de la disponibilité d'alternatives à moindre coût.
L'épisode DeepSeek a mis en lumière plusieurs aspects clés du marché actuel :
L'impact de DeepSeek sur le marché boursier souligne l'influence significative que les avancées en IA peuvent avoir sur le sentiment des investisseurs et la dynamique du marché. Alors que le paysage de l'IA continue d'évoluer, nous devrions probablement voir d'autres fluctuations et ajustements à mesure que le marché s'adapte aux innovations et aux pressions concurrentielles.
L'ascension rapide de DeepSeek a déclenché d'importantes préoccupations géopolitiques, en particulier aux États-Unis, où son impact potentiel sur la sécurité nationale et la course aux armements en IA est scruté de près. Les origines chinoises de l'entreprise et les capacités de ses modèles d'IA ont suscité des craintes d'espionnage, de campagnes d'influence et d'un changement dans l'équilibre des pouvoirs dans le paysage mondial de l'IA.
Préoccupations en matière de Sécurité Nationale :
Perspectives Différentes sur les