AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs Qwen: Qwen3.5-35B-A3B

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-04-24

指標	DeepSeek V4 Flash DeepSeek V4 Flash high リリース: 2026-04-24	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium リリース: 2026-02-24

指標	DeepSeek V4 Flash DeepSeek V4 Flash high リリース: 2026-04-24	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium リリース: 2026-02-24
スコア	7.8	7.4
順位	#35	#49
一貫性	7.8	6.7
正解テスト
試行ごとの合格率	79.6%	79.6%
不安定なテスト	5	7
総実行回数	52	54
結果あたりのコスト	0.189	3.976
合計コスト	$0.021	$0.398
????	$0.140 / 1M	$0.163 / 1M
????	$0.280 / 1M	$1.300 / 1M
出力トークン	1,757	10,137
推論トークン	55,907	208,761
応答時間（平均）	47.47s	44.51s
応答時間（最大）	255.28s	106.00s
応答時間（合計）	854.45s	801.21s

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

スコア vs 応答時間（平均）

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
DeepSeek V4 Flash	8.3	10.0	75.0%	0		28.51s	140	7,770
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		21.13s	798	42,652

コーディング	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
DeepSeek V4 Flash	10.0	10.0	100.0%	0		62.48s	369	9,361
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		79.09s	4,273	33,078

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
DeepSeek V4 Flash	10.0	10.0	100.0%	0		76.57s	465	7,347
Qwen3.5-35B-A3B	4.7	1.6	66.7%	1		75.34s	775	12,485

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
DeepSeek V4 Flash	10.0	10.0	100.0%	0		28.03s	201	1,179
Qwen3.5-35B-A3B	7.3	5.9	83.3%	1		59.33s	235	19,493

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
DeepSeek V4 Flash	4.1	4.4	44.5%	2		112.69s	19	24,857
Qwen3.5-35B-A3B	4.1	4.4	44.5%	2		88.34s	41	46,368

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
DeepSeek V4 Flash	6.1	3.1	66.7%	1		25.15s	79	632
Qwen3.5-35B-A3B	2.8	1.6	33.3%	1		30.30s	20	3,753

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
DeepSeek V4 Flash	10.0	10.0	100.0%	0		15.36s	63	1,622
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		24.45s	97	17,361

パズル解決	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
DeepSeek V4 Flash	6.4	4.5	77.8%	2		25.53s	193	2,597
Qwen3.5-35B-A3B	6.4	4.4	77.8%	2		31.58s	3,589	32,206

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
DeepSeek V4 Flash	10.0	10.0	100.0%	0		74.73s	228	542
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		4.65s	309	1,365

クイック比較

比較ペアを切り替え

Claude Sonnet 4.6nonevsQwen3.5-35B-A3Bmedium DeepSeek V4 FlashhighvsGLM 5V Turbomedium DeepSeek V4 FlashhighvsQwen3.5-Flashmedium DeepSeek V4 ProhighvsQwen3.5-35B-A3Bmedium DeepSeek V4 FlashhighvsGLM 5.1medium DeepSeek V4 FlashhighvsStep 3.5 Flashmedium DeepSeek V4 FlashhighvsGemini 3.1 Flash Lite Previewnone DeepSeek V4 FlashhighvsGPT-5.2 Chatnone DeepSeek V4 FlashhighvsMiMo-V2.5medium DeepSeek V4 FlashhighvsKimi K2.6medium DeepSeek V4 FlashhighvsMiMo-V2-Omnimedium DeepSeek V4 FlashhighvsGPT-5.3 Chatnone