Claude Sonnet 4.6 (medium) vs DeepSeek V4 Flash (high)

順位: #51
合計出力トークン: 115,865
応答時間（平均）: 25.91s
合計コスト: $2.057

順位: #57
合計出力トークン: 168,165
応答時間（平均）: 49.75s
合計コスト: $0.060

おすすめモデル DeepSeek V4 Flash (high)

スコアはここでの最高値に近く（7.7 vs 7.8）、Claude Sonnet 4.6 (medium) より約 34.4 倍低コストです。

詳細比較

指標	Claude Sonnet 4.6 Claude Sonnet 4.6 medium リリース: 2026-02-17	DeepSeek V4 Flash DeepSeek V4 Flash high リリース: 2026-04-24

指標	Claude Sonnet 4.6 Claude Sonnet 4.6 medium リリース: 2026-02-17	DeepSeek V4 Flash DeepSeek V4 Flash high リリース: 2026-04-24
スコア	7.8	7.7
順位	#51	#57
信頼性	10.0	10.0
一貫性	9.2	8.2
正解テスト
試行ごとの合格率	66.7%	72.7%
不安定なテスト	2	5
総実行回数	66	66
結果あたりのコスト	14.692	0.402
合計コスト	$2.057	$0.060
入力価格	$3.000 / 1M	$0.140 / 1M
出力価格	$15.000 / 1M	$0.280 / 1M
合計入力トークン	106,292	108,392
出力トークン	80,748	14,478
推論トークン	35,117	153,687
応答時間（平均）	25.91s	49.75s
応答時間（最大）	140.96s	218.13s
応答時間（合計）	362.78s	1094.41s

モデル生成ショーケース

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#51 Claude Sonnet 4.6

medium

無効なSVG

コスト: $0.000
時間: 300.0s
トークン: 0 tok

#57 DeepSeek V4 Flash

high

コスト: $0.003
時間: 93.1s
トークン: 7,926 tok

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

スコア vs 応答時間（平均）

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

カテゴリ:

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	6.5	10.0	50.0%	0		2.98s	789	1,046	1,093
DeepSeek V4 Flash	8.3	10.0	75.0%	0		28.51s	540	140	7,770

コーディング	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	5.7	6.6	44.4%	1		33.29s	6,995	16,089	3,686
DeepSeek V4 Flash	7.8	10.0	66.7%	0		50.60s	7,279	395	34,862

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	10.0	10.0	100.0%	0		93.65s	75,531	31,916	9,109
DeepSeek V4 Flash	6.4	5.8	66.7%	1		104.10s	82,663	4,633	37,533

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	10.0	10.0	100.0%	0		13.90s	8,676	649	742
DeepSeek V4 Flash	10.0	10.0	100.0%	0		28.03s	7,290	201	1,179

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	2.9	7.2	11.1%	1		0ms	471	25,790	16,919
DeepSeek V4 Flash	4.1	4.4	44.5%	2		100.31s	666	27	59,249

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.94s	564	256	433
DeepSeek V4 Flash	6.1	3.1	66.7%	1		25.15s	471	79	632

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	10.0	10.0	100.0%	0		2.61s	792	318	552
DeepSeek V4 Flash	10.0	10.0	100.0%	0		15.36s	627	63	1,622

パズル解決	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	10.0	10.0	100.0%	0		5.31s	816	592	646
DeepSeek V4 Flash	8.2	7.2	88.9%	1		26.11s	594	196	1,767

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	10.0	10.0	100.0%	0		7.48s	11,454	655	351
DeepSeek V4 Flash	10.0	10.0	100.0%	0		74.73s	8,079	228	542

雑学	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Claude Sonnet 4.6	3.0	10.0	0.0%	0		30.09s	204	3,437	1,586
DeepSeek V4 Flash	3.0	10.0	0.0%	0		54.46s	183	8,516	8,531

クイック比較

比較ペアを切り替え

Claude Opus 4.6mediumvsDeepSeek V4 Flashhigh Claude Sonnet 4.6mediumvsQwen3.7 Flashhigh DeepSeek V4 FlashhighvsGLM 5medium DeepSeek V4 FlashhighvsMiniMax M3medium DeepSeek V4 FlashhighvsGrok Build 0.1medium Claude Opus 4.8lowvsDeepSeek V4 Flashhigh DeepSeek V4 FlashhighvsGPT-5.6 Lunamedium DeepSeek V4 FlashhighvsNemotron 3 Ultramedium無料で利用可能 Claude Opus 5nonevsDeepSeek V4 Flashhigh Claude Sonnet 4.6mediumvsGPT-5.6 Lunahigh Claude Sonnet 4.6mediumvsGPT-5.6 Terrahigh Claude Sonnet 4.6mediumvsKimi K3max