ナビゲーション
AI BENCHY
比較する チャート 方法論
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Xiaomi: MiMo-V2-Flash

比較する:

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-03-06

指標 Google: Gemini 3.1 Flash Lite Preview low リリース: 2026-03-03 Xiaomi: MiMo-V2-Flash medium リリース: 2025-12-16
平均スコア 7.6 7.5
順位 #12 #17
正解テスト
一貫性 10.0 9.4
結果あたりのコスト 0.170 0.314
合計コスト $0.019 $0.035
試行ごとの合格率 73.3% 77.8%
不安定なテスト 0 1
common.totalRuns 45 (15 x 3) 45 (15 x 3)
出力トークン 1,542 11,526
推論トークン 6,888 106,226
応答時間(平均) 3.49s 27.68s
応答時間(最大) 11.91s 96.01s
応答時間(合計) 52.29s 249.14s

スコア上位モデル

スコア vs 総コスト

応答時間(平均)

平均スコア vs 応答時間(平均)

カテゴリ内訳

反AIトリック スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Google: Gemini 3.1 Flash Lite Preview 7.0 10.0 66.7% 0 2.18s 456 1,224
Xiaomi: MiMo-V2-Flash 9.7 10.0 100.0% 0 16.79s 1,328 18,739
複合 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 0.0% 0 11.91s 225 762
Xiaomi: MiMo-V2-Flash 9.0 10.0 100.0% 0 75.68s 442 26,859
データ解析と抽出 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Google: Gemini 3.1 Flash Lite Preview 9.9 10.0 100.0% 0 3.00s 291 696
Xiaomi: MiMo-V2-Flash 5.5 10.0 50.0% 0 0ms 153 0
ドメイン特化 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Google: Gemini 3.1 Flash Lite Preview 4.0 10.0 33.3% 0 2.36s 18 1,212
Xiaomi: MiMo-V2-Flash 4.0 7.2 55.6% 1 96.01s 8,374 42,461
指示追従 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.49s 72 753
Xiaomi: MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 75 3,504
Puzzle Solving スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.76s 243 1,248
Xiaomi: MiMo-V2-Flash 7.0 10.0 66.7% 0 3.77s 833 1,948
ツール呼び出し スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Google: Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 9.54s 237 993
Xiaomi: MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 321 12,715

クイック比較

比較ペアを切り替え