AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs HY3 Preview

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-04-27

指標	DeepSeek V4 Flash DeepSeek V4 Flash high リリース: 2026-04-24	HY3 Preview HY3 Preview medium リリース: 2026-04-22 無料で利用可能

指標	DeepSeek V4 Flash DeepSeek V4 Flash high リリース: 2026-04-24	HY3 Preview HY3 Preview medium リリース: 2026-04-22 無料で利用可能
スコア	7.8	8.1
順位	#41	#33
信頼性	10.0	該当なし
一貫性	7.8	9.6
正解テスト
試行ごとの合格率	79.6%	74.1%
不安定なテスト	5	1
総実行回数	54	54
結果あたりのコスト	0.277	0.000
合計コスト	$0.031	$0.000
????	$0.140 / 1M	$0.000 / 1M
????	$0.280 / 1M	$0.000 / 1M
出力トークン	1,765	65,057
推論トークン	90,299	0
応答時間（平均）	45.41s	14.63s
応答時間（最大）	218.13s	46.04s
応答時間（合計）	817.30s	248.72s

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

スコア vs 応答時間（平均）

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
DeepSeek V4 Flash	8.3	10.0	75.0%	0		28.51s	140	7,770
HY3 Preview	10.0	10.0	100.0%	0		6.59s	5,955	0

コーディング	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
DeepSeek V4 Flash	10.0	10.0	100.0%	0		62.48s	369	9,361
HY3 Preview	10.0	10.0	100.0%	0		31.37s	8,054	0

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
DeepSeek V4 Flash	10.0	10.0	100.0%	0		76.57s	465	7,347
HY3 Preview	10.0	10.0	100.0%	0		46.04s	12,018	0

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
DeepSeek V4 Flash	10.0	10.0	100.0%	0		28.03s	201	1,179
HY3 Preview	6.5	10.0	50.0%	0		5.25s	930	0

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
DeepSeek V4 Flash	4.1	4.4	44.5%	2		100.31s	27	59,249
HY3 Preview	5.3	10.0	33.3%	0		22.30s	22,527	0

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
DeepSeek V4 Flash	6.1	3.1	66.7%	1		25.15s	79	632
HY3 Preview	10.0	10.0	100.0%	0		16.84s	2,448	0

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
DeepSeek V4 Flash	10.0	10.0	100.0%	0		15.36s	63	1,622
HY3 Preview	10.0	10.0	100.0%	0		6.16s	2,967	0

パズル解決	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
DeepSeek V4 Flash	6.4	4.5	77.8%	2		25.53s	193	2,597
HY3 Preview	5.3	7.4	44.4%	1		9.55s	7,062	0

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
DeepSeek V4 Flash	10.0	10.0	100.0%	0		74.73s	228	542
HY3 Preview	10.0	10.0	100.0%	0		15.02s	3,096	0

クイック比較

比較ペアを切り替え

DeepSeek V4 FlashhighvsGLM 5V Turbomedium DeepSeek V4 FlashhighvsQwen3.5-Flashmedium DeepSeek V4 FlashhighvsGLM 5.1medium DeepSeek V4 FlashhighvsStep 3.5 Flashmedium Gemini 3.1 Flash Lite PreviewlowvsHY3 Previewmedium無料で利用可能 DeepSeek V4 FlashhighvsGemini 3.1 Flash Lite Previewnone Gemini 3 Flash PreviewnonevsHY3 Previewmedium無料で利用可能 DeepSeek V4 FlashhighvsGPT-5.2 Chatnone DeepSeek V4 FlashhighvsMiMo-V2.5medium DeepSeek V4 FlashhighvsKimi K2.6medium GPT-5.2 ChatnonevsHY3 Previewmedium無料で利用可能 DeepSeek V4 FlashhighvsMiMo-V2-Omnimedium