広場
最新
注目
ニュース
プロフィール
ポスト
SoulBrother
2026-04-24 03:54:27
フォロー
DeepSeek V4ついにリリース!
比較してみた
現在最も強力なオープンソースモデルとなる
コード、数学、長文、エージェントの4大分野で世界トップクラスに達し、一部指標はGPT-4o、Claude Opus 4.6を超える。
一、バージョンと位置付け
- V4-Pro:フラッグシップ、GPT-4o/Opus 4.6に対抗、オープンソース最強。
- V4-Flash:軽量高速、コストパフォーマンス高。
- アーキテクチャ:1.6TパラメータのMoE、毎回約370Bを活性化;100万トークンのコンテキスト。
- 計算能力:Huawei昇腾950PRのフルスタック、NVIDIA離れ。
二、コア性能比較(権威ある評価)
1️⃣ プログラミング(最強項目)
- HumanEval:90%(>Opus 4.5 88%、>GPT-4 82%)。
- SWE-Bench:>80%、実際のソフトウェアエンジニアリング能力でリード。
- 結論:世界最強のAIプログラマー。
2️⃣ 数学/推論
- MATH/STEM:すべてのオープンソースモデルを超越、GPT-4o/Opus 4.6に匹敵。
- エージェント能力:Agentic Codingはオープンソース最高、Claude Sonnet 4.5を上回り、Opus 4.6に近い(思考モード非使用)。
3️⃣ 長文
- コンテキスト:1Mトークン(約70万漢字)、世界トップ3(Gemini 3.1に次ぐ)。
- 実測:百万字の小説/全ライブラリ分析も崩れず、長文において最強の国産モデル。
4️⃣ 世界知識
- すべてのオープンソースモデルをリード、Gemini 3.1 Proにやや劣る。
三、総合ランキング(2026.4.24)
- クローズドソース第一梯隊:
1. Gemini 3.1 Pro(推論/長文最強)
2. Claude Opus 4.6(万能バランス型)
3. GPT-4o(エコシステム最強)
4. DeepSeek V4-Pro(コード/長文トップ、国産第一)
- オープンソース第一梯隊:
- DeepSeek V4-Pro(絶対第一、Llama 3/Qwen 3を全面リード)
四、主要な優位点
- ✅ コード最強:GPT-4o/Claudeを超え、エンジニアリングレベルのタスク能力。
- ✅ 1Mのコンテキスト:長文処理で世界トップクラス。
- ✅ 国産計算能力:昇腾フルスタック、コストはGPT-4の1/70。
- ✅ オープンソースで商用利用可能:V4-Pro/FlashはMITライセンス。
五、短所
- 総合能力はGemini 3.1/Opus 4.6にやや劣る(特に深度推論)。
- マルチモーダル(画像・文章)能力はGPT-4o/Geminiに劣る。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
報酬
いいね
コメント
リポスト
共有
コメント
コメントを追加
コメントを追加
コメント
コメントなし
人気の話題
もっと見る
#
TradfiTradingChallenge
137.14K 人気度
#
PYTHUnlocks2.13BillionTokens
925.96K 人気度
#
IsraelStrikesIranBTCPlunges
47.93K 人気度
#
#DailyPolymarketHotspot
1.01M 人気度
#
TrumpDelaysIranStrike
16.08M 人気度
ピン留め
サイトマップ
DeepSeek V4ついにリリース!
比較してみた
現在最も強力なオープンソースモデルとなる
コード、数学、長文、エージェントの4大分野で世界トップクラスに達し、一部指標はGPT-4o、Claude Opus 4.6を超える。
一、バージョンと位置付け
- V4-Pro:フラッグシップ、GPT-4o/Opus 4.6に対抗、オープンソース最強。
- V4-Flash:軽量高速、コストパフォーマンス高。
- アーキテクチャ:1.6TパラメータのMoE、毎回約370Bを活性化;100万トークンのコンテキスト。
- 計算能力:Huawei昇腾950PRのフルスタック、NVIDIA離れ。
二、コア性能比較(権威ある評価)
1️⃣ プログラミング(最強項目)
- HumanEval:90%(>Opus 4.5 88%、>GPT-4 82%)。
- SWE-Bench:>80%、実際のソフトウェアエンジニアリング能力でリード。
- 結論:世界最強のAIプログラマー。
2️⃣ 数学/推論
- MATH/STEM:すべてのオープンソースモデルを超越、GPT-4o/Opus 4.6に匹敵。
- エージェント能力:Agentic Codingはオープンソース最高、Claude Sonnet 4.5を上回り、Opus 4.6に近い(思考モード非使用)。
3️⃣ 長文
- コンテキスト:1Mトークン(約70万漢字)、世界トップ3(Gemini 3.1に次ぐ)。
- 実測:百万字の小説/全ライブラリ分析も崩れず、長文において最強の国産モデル。
4️⃣ 世界知識
- すべてのオープンソースモデルをリード、Gemini 3.1 Proにやや劣る。
三、総合ランキング(2026.4.24)
- クローズドソース第一梯隊:
1. Gemini 3.1 Pro(推論/長文最強)
2. Claude Opus 4.6(万能バランス型)
3. GPT-4o(エコシステム最強)
4. DeepSeek V4-Pro(コード/長文トップ、国産第一)
- オープンソース第一梯隊:
- DeepSeek V4-Pro(絶対第一、Llama 3/Qwen 3を全面リード)
四、主要な優位点
- ✅ コード最強:GPT-4o/Claudeを超え、エンジニアリングレベルのタスク能力。
- ✅ 1Mのコンテキスト:長文処理で世界トップクラス。
- ✅ 国産計算能力:昇腾フルスタック、コストはGPT-4の1/70。
- ✅ オープンソースで商用利用可能:V4-Pro/FlashはMITライセンス。
五、短所
- 総合能力はGemini 3.1/Opus 4.6にやや劣る(特に深度推論)。
- マルチモーダル(画像・文章)能力はGPT-4o/Geminiに劣る。