DeepSeek V4ついにリリース!


比較してみた
現在最も強力なオープンソースモデルとなる
コード、数学、長文、エージェントの4大分野で世界トップクラスに達し、一部指標はGPT-4o、Claude Opus 4.6を超える。

一、バージョンと位置付け

- V4-Pro:フラッグシップ、GPT-4o/Opus 4.6に対抗、オープンソース最強。
- V4-Flash:軽量高速、コストパフォーマンス高。
- アーキテクチャ:1.6TパラメータのMoE、毎回約370Bを活性化;100万トークンのコンテキスト。
- 計算能力:Huawei昇腾950PRのフルスタック、NVIDIA離れ。

二、コア性能比較(権威ある評価)

1️⃣ プログラミング(最強項目)

- HumanEval:90%(>Opus 4.5 88%、>GPT-4 82%)。
- SWE-Bench:>80%、実際のソフトウェアエンジニアリング能力でリード。
- 結論:世界最強のAIプログラマー。

2️⃣ 数学/推論

- MATH/STEM:すべてのオープンソースモデルを超越、GPT-4o/Opus 4.6に匹敵。
- エージェント能力:Agentic Codingはオープンソース最高、Claude Sonnet 4.5を上回り、Opus 4.6に近い(思考モード非使用)。

3️⃣ 長文

- コンテキスト:1Mトークン(約70万漢字)、世界トップ3(Gemini 3.1に次ぐ)。
- 実測:百万字の小説/全ライブラリ分析も崩れず、長文において最強の国産モデル。

4️⃣ 世界知識

- すべてのオープンソースモデルをリード、Gemini 3.1 Proにやや劣る。

三、総合ランキング(2026.4.24)

- クローズドソース第一梯隊:
1. Gemini 3.1 Pro(推論/長文最強)
2. Claude Opus 4.6(万能バランス型)
3. GPT-4o(エコシステム最強)
4. DeepSeek V4-Pro(コード/長文トップ、国産第一)
- オープンソース第一梯隊:
- DeepSeek V4-Pro(絶対第一、Llama 3/Qwen 3を全面リード)

四、主要な優位点

- ✅ コード最強:GPT-4o/Claudeを超え、エンジニアリングレベルのタスク能力。
- ✅ 1Mのコンテキスト:長文処理で世界トップクラス。
- ✅ 国産計算能力:昇腾フルスタック、コストはGPT-4の1/70。
- ✅ オープンソースで商用利用可能:V4-Pro/FlashはMITライセンス。

五、短所

- 総合能力はGemini 3.1/Opus 4.6にやや劣る(特に深度推論)。
- マルチモーダル(画像・文章)能力はGPT-4o/Geminiに劣る。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン留め