DeepSeekは、2023年に設立された杭州拠点のスタートアップであり、OpenAIやGoogleといった米国の既存大手企業の支配に挑戦し、AI分野で急速に重要なプレイヤーとして浮上しています。本記事では、DeepSeekの急激な台頭の背景、その市場への影響、そして開発・展開にまつわる論争について探ります。
DeepSeekがAI業界で急速に注目を集めたのは複数の要因が絡み合っており、興奮と論争の両面を生んでいます。同社が600万ドルという低コストで高性能モデルを開発したと主張したことが関心と懐疑を呼びました。専門家の中には、この数字はトレーニングコストを反映しているかもしれませんが、データ取得や研究といった重要な費用が考慮されていないと指摘する声もあります。
DeepSeekは中国国内で入手可能な比較的性能の低いGPUを使用したとされていますが、高度なポストトレーニング技術の活用も成功の要因です。このコスト効率の良さは投資家に警戒感を与え、「DeepSeek売り」が発生し、高性能GPUの将来需要に対する懸念を引き起こしました。
さらに、DeepSeekのオープンソース戦略や米国ベースのAIプロバイダーに代わる選択肢への需要の高まりも魅力を増しています。一方で、モデルの厳格な検閲体制は情報統制への懸念を生み、AIセーフティに関する弱点も指摘されています。
また、DeepSeekの優れたエネルギー効率に関する主張は議論の的となっており、一部の研究ではその性能が過大評価されている可能性が示唆されています。最後に、DeepSeekの登場は地政学的な影響も持ち、米国のAI競争力や政府の対応(他の中国テック企業への制裁に類似した禁止措置の可能性を含む)に関する議論を巻き起こしています。
DeepSeekがテック界の注目を集める理由は以下の通りです:
39歳のDeepSeek創業者、梁文峰は、中国のテックシーンで急速に注目を集めており、米国の輸出規制を克服しAI分野でのリーダーシップを目指す国家の野望を体現しています。これまで目立たない存在でしたが、李強首相主催の非公開シンポジウムに出席したことで、北京政府がDeepSeekのグローバルAI秩序再編の可能性を認識していることが示されました。DeepSeekが低コストのAIアシスタントを発表し世界的な注目を集める一方で、梁のビジョンは商業的応用を超えています。多くの中国テックリーダーが既存技術のスケールアップに注力する中、梁は人工汎用知能(AGI)の創出を目指した基礎研究開発を優先しています。この独創性へのこだわりは、中国の伝統的な模倣的アプローチからの脱却を示し、世界舞台で真に競争力を持つためには根本的なブレークスルーが必要だと考えています。DeepSeekのオープンソース戦略は、かつて米国のテックインサイダーが推進した手法を踏襲し、イノベーション促進とAIコミュニティ内での「ソフトパワー」構築へのコミットメントを示しています。浙江大学での学術経験から、成功したクオンツヘッジファンドの共同設立まで、多彩な経歴を持つ梁は、知的好奇心とビジネスセンスを兼ね備えています。ヘッジファンドがAI研究に軸足を移し、DeepSeekの創設に至った経緯は、「世界で最も難しい問題」に挑むという梁の志と、AGI達成を目指す優秀な人材を惹きつける力を物語っています。梁の歩みは、中国テック産業が模倣から独創的イノベーションへ、そしてAI支配への長期的ビジョンへとシフトしていることを象徴しています。
出典: panewslab
DeepSeekはOpenAIの競合として急速に台頭していますが、アプローチは異なります。2015年設立のOpenAIは幅広いAI能力とDALL-EやWhisperなど多様な専門モデルに注力しているのに対し、2023年設立のDeepSeekは効率的でオープンソースのモデルを重視し、特に推論能力にフォーカスしています。この違いは、OpenAIのGPT-4やo1モデルと、DeepSeekのV3やR1モデルに表れています。DeepSeekのトレーニング手法はOpenAIの教師あり学習や指示ベースのファインチューニングとは大きく異なり、強化学習、洗練された報酬設計、知識蒸留によるモデル圧縮、「エマージェントビヘイビアネットワーク」と呼ばれる複雑な推論が自然発生する仕組みを活用しています。これらの革新により、DeepSeekは特に推論タスクでOpenAIのo1に匹敵する性能を、はるかに低コストで実現しています。DeepSeekはR1モデルの開発にかかった費用を600万ドル未満と主張しており、OpenAIのo1にかかる数億ドルと大きく対照的です。このコスト優位性は効率的なトレーニング手法と安価なハードウェアの利用に起因しています。DeepSeekは設立以来、DeepSeek Coder(コーディング用)、汎用DeepSeek LLM、DeepSeek-V2やDeepSeek-Coder-V2といった強力なバージョンを次々にリリースしてきました。現在のフラッグシップモデルであるDeepSeek-V3と推論特化型DeepSeek-R1は共に6710億パラメータ、128,000トークンのコンテキストウィンドウを備えています。さらに、DeepSeekは視覚分野にも進出し、Janus-Pro-7Bをリリースして多様なAI領域での競争を目指しています。
JanusおよびJanus-Pro-7B:DeepSeekの能力拡大
DeepSeekはテキストから画像生成を行うオープンソースAIモデル、Janus-Pro-7Bをリリースし、複数のAI分野での競争を目指す野心を示しています。
DeepSeekのオープンソースモデルへのコミットメントと効率的なトレーニング、先進的な推論能力への注力は、AI分野における重要なディスラプターとしての地位を確立しています。
DeepSeekの主な特徴と応用
DeepSeekは多様な応用に適した汎用性の高いAIツールとして、以下の特徴と能力を提供しています:
DeepSeekの登場はAI分野を揺るがしただけでなく、特にテック大手に対して株式市場にも大きな衝撃を与えました。DeepSeekのローンチ直後、ナスダックは急落し、Nvidiaは約6000億ドルの時価総額を一日で失う過去最大の損失を記録しました。この急激な下落は、DeepSeekの低開発コストかつオープンソースモデルが米国AI企業を脅かすとの懸念によるものでした。Nvidiaにとどまらず、AI関連の半導体、電力、インフラ企業も影響を受け、合計で1兆ドル以上の価値が失われました。
しかし、この初期のパニックは沈静化し、投資家が状況を再評価しました。バーゲンハンターが参入し、テック株は部分的に回復。Nvidiaは8.9%の上昇を見せ、テックセクター全体も3.6%の上昇となりました。この反発は、DeepSeekの登場が重要な出来事である一方で、投資家が低コスト代替の有無にかかわらず高性能AIソリューションの需要は継続すると認識していることを示しています。
DeepSeekの件は現市場のいくつかの重要な側面を浮き彫りにしました:
DeepSeekの市場への影響は、AIの進歩が投資家心理や市場ダイナミクスに大きな影響を与えることを示しています。AI分野が進化を続ける中、市場はイノベーションや競争圧力に適応し、さらなる変動や調整が見られるでしょう。
DeepSeekの急速な台頭は、特に米国において国家安全保障やAI軍拡競争に関する重大な地政学的懸念を引き起こしています。同社の中国起源とAIモデルの能力は、ス