Claude Sonnet 4.6 (medium) vs DeepSeek V4 Pro (high)

順位: #51
合計出力トークン: 115,865
応答時間（平均）: 25.91s
合計コスト: $2.057

順位: #58
合計出力トークン: 189,181
応答時間（平均）: 79.14s
合計コスト: $0.200

おすすめモデル DeepSeek V4 Pro (high)

スコアはここでの最高値に近く（7.7 vs 7.8）、Claude Sonnet 4.6 (medium) より約 10.3 倍低コストです。

詳細比較

指標	Claude Sonnet 4.6 Claude Sonnet 4.6 medium リリース: 2026-02-17	DeepSeek V4 Pro DeepSeek V4 Pro high リリース: 2026-04-24

指標	Claude Sonnet 4.6 Claude Sonnet 4.6 medium リリース: 2026-02-17	DeepSeek V4 Pro DeepSeek V4 Pro high リリース: 2026-04-24
スコア	7.8	7.7
順位	#51	#58
信頼性	10.0	10.0
一貫性	9.2	7.7
正解テスト
試行ごとの合格率	66.7%	63.6%
不安定なテスト	2	6
総実行回数	66	66
結果あたりのコスト	14.692	2.000
合計コスト	$2.057	$0.200
入力価格	$3.000 / 1M	$0.435 / 1M
出力価格	$15.000 / 1M	$0.870 / 1M
合計入力トークン	106,292	90,748
出力トークン	80,748	10,462
推論トークン	35,117	178,719
応答時間（平均）	25.91s	79.14s
応答時間（最大）	140.96s	416.76s
応答時間（合計）	362.78s	1740.97s

モデル生成ショーケース

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#51 Claude Sonnet 4.6

medium

無効なSVG

コスト: $0.000
時間: 300.0s
トークン: 0 tok

#58 DeepSeek V4 Pro

high

コスト: $0.023
時間: 257.6s
トークン: 14,870 tok

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

スコア vs 応答時間（平均）

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

カテゴリ:

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	6.5	10.0	50.0%	0		2.98s	789	1,046	1,093
DeepSeek V4 Pro	5.7	5.9	58.3%	2		25.70s	536	149	3,214

コーディング	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	5.7	6.6	44.4%	1		33.29s	6,995	16,089	3,686
DeepSeek V4 Pro	6.3	8.7	33.3%	0		243.00s	5,090	383	84,580

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	10.0	10.0	100.0%	0		93.65s	75,531	31,916	9,109
DeepSeek V4 Pro	10.0	10.0	100.0%	0		78.99s	66,082	4,582	25,404

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	10.0	10.0	100.0%	0		13.90s	8,676	649	742
DeepSeek V4 Pro	10.0	10.0	100.0%	0		25.03s	7,690	274	2,166

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	2.9	7.2	11.1%	1		0ms	471	25,790	16,919
DeepSeek V4 Pro	3.6	7.2	22.2%	1		151.46s	569	4,404	50,391

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.94s	564	256	433
DeepSeek V4 Pro	10.0	10.0	100.0%	0		8.83s	471	115	1,013

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	10.0	10.0	100.0%	0		2.61s	792	318	552
DeepSeek V4 Pro	7.8	6.6	83.3%	1		8.73s	627	66	2,726

パズル解決	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	10.0	10.0	100.0%	0		5.31s	816	592	646
DeepSeek V4 Pro	6.9	4.9	77.8%	2		56.85s	591	178	2,563

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	10.0	10.0	100.0%	0		7.48s	11,454	655	351
DeepSeek V4 Pro	9.8	10.0	100.0%	0		15.92s	8,909	295	701

雑学	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	3.0	10.0	0.0%	0		30.09s	204	3,437	1,586
DeepSeek V4 Pro	3.0	10.0	0.0%	0		34.01s	183	16	5,961

クイック比較

比較ペアを切り替え

Claude Sonnet 4.6mediumvsQwen3.7 Flashhigh Claude Opus 4.6mediumvsDeepSeek V4 Prohigh DeepSeek V4 ProhighvsMiniMax M3medium DeepSeek V4 ProhighvsGLM 5medium DeepSeek V4 ProhighvsGrok Build 0.1medium DeepSeek V4 ProhighvsGPT-5.6 Lunamedium Claude Opus 4.8lowvsDeepSeek V4 Prohigh DeepSeek V4 ProhighvsNemotron 3 Ultramedium無料で利用可能 Claude Opus 5nonevsDeepSeek V4 Prohigh DeepSeek V4 ProhighvsKimi K2.7 Codemedium Claude Sonnet 4.6mediumvsGPT-5.6 Lunahigh Claude Sonnet 4.6mediumvsGPT-5.6 Terrahigh