AI BENCHY Compare

Google: Gemini 3 Flash Preview vs Xiaomi: MiMo-V2-Pro

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-03-20

指標	Gemini 3 Flash Preview Gemini 3 Flash Preview low リリース: 2025-12-17	MiMo-V2-Pro MiMo-V2-Pro medium リリース: 2026-03-18

指標	Gemini 3 Flash Preview Gemini 3 Flash Preview low リリース: 2025-12-17	MiMo-V2-Pro MiMo-V2-Pro medium リリース: 2026-03-18
スコア	8.7	8.0
順位	#3	#20
一貫性	9.5	8.5
正解テスト
試行ごとの合格率	84.3%	76.5%
不安定なテスト	1	3
総実行回数	51	45
結果あたりのコスト	0.577	1.110
合計コスト	$0.081	$0.123
????	$0.500 / 1M	$1.000 / 1M
????	$3.000 / 1M	$3.000 / 1M
出力トークン	1,592	1,875
推論トークン	20,556	26,959
応答時間（平均）	5.95s	9.78s
応答時間（最大）	14.72s	64.71s
応答時間（合計）	101.19s	156.45s

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

スコア vs 応答時間（平均）

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		3.48s	281	3,082
MiMo-V2-Pro	10.0	10.0	100.0%	0		3.06s	223	1,107

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Gemini 3 Flash Preview	3.0	10.0	0.0%	0		3.27s	326	0
MiMo-V2-Pro	4.7	1.6	66.7%	1		64.71s	380	14,186

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		9.40s	279	3,656
MiMo-V2-Pro	7.3	5.8	83.3%	1		17.20s	260	7,484

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Gemini 3 Flash Preview	5.3	7.2	44.4%	1		8.05s	12	6,410
MiMo-V2-Pro	5.3	10.0	33.3%	0		6.00s	155	1,048

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		3.68s	120	981
MiMo-V2-Pro	10.0	10.0	100.0%	0		4.06s	198	424

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Gemini 3 Flash Preview	9.9	10.0	100.0%	0		7.02s	71	2,752
MiMo-V2-Pro	9.9	10.0	100.0%	0		3.36s	83	667

Puzzle Solving	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		6.11s	269	3,260
MiMo-V2-Pro	7.0	7.2	55.6%	1		4.71s	313	1,179

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		4.99s	234	415
MiMo-V2-Pro	10.0	10.0	100.0%	0		8.19s	263	864

クイック比較

比較ペアを切り替え

Gemini 3 Flash PreviewnonevsMiMo-V2-Promedium Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2-Promedium Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2-Promedium GPT-5.2 ChatnonevsMiMo-V2-Promedium Seed-2.0-LitemediumvsGemini 3 Flash Previewlow Gemini 3 Flash PreviewlowvsGPT-5.3-Codexmedium Gemini 3 Flash PreviewlowvsQwen3.5 Plus 2026-02-15medium Gemini 3 Flash PreviewlowvsQwen3.5-122B-A10Bmedium Gemini 3 Flash PreviewlowvsQwen3.5-27Bmedium GPT-5.3 ChatnonevsMiMo-V2-Promedium Gemini 3 Flash PreviewlowvsGLM 5medium DeepSeek V3.2mediumvsGemini 3 Flash Previewlow