ナビゲーション
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Nemotron 3 Super 120b A12b

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-03-12

指標 Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none リリース: 2026-03-03 Nemotron 3 Super 120b A12b Nemotron 3 Super 120b A12b medium リリース: 2026-03-11 無料で利用可能
順位 #23 #36
平均スコア 7.1 5.8
一貫性 9.6 8.5
結果あたりのコスト 0.144 0.000
合計コスト $0.015 $0.000
正解テスト
試行ごとの合格率 66.7% 56.3%
不安定なテスト 1 3
総実行回数 48 48
出力トークン 4,715 11,925
推論トークン 0 29,687
応答時間(平均) 1.33s 20.24s
応答時間(最大) 3.39s 87.80s
応答時間(合計) 21.27s 303.60s

スコア上位モデル

スコア vs 総コスト

応答時間(平均)

平均スコア vs 応答時間(平均)

合計出力トークン

平均スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Gemini 3.1 Flash Lite Preview 6.0 7.8 55.6% 1 1.16s 1,086 0
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 12.96s 1,754 3,264
複合 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Gemini 3.1 Flash Lite Preview 10.0 10.0 0.0% 0 3.20s 339 0
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 87.80s 2,021 9,996
データ解析と抽出 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Gemini 3.1 Flash Lite Preview 9.9 10.0 100.0% 0 1.22s 399 0
Nemotron 3 Super 120b A12b 9.9 10.0 100.0% 0 18.16s 877 2,607
ドメイン特化 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Gemini 3.1 Flash Lite Preview 4.0 10.0 33.3% 0 942ms 568 0
Nemotron 3 Super 120b A12b 10.0 4.4 22.2% 2 16.19s 5,255 6,072
汎用知能 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 741ms 69 0
Nemotron 3 Super 120b A12b 2.0 9.9 0.0% 0 27.86s 104 1,149
指示追従 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.13s 574 0
Nemotron 3 Super 120b A12b 7.0 6.5 66.7% 1 7.72s 1,042 2,479
Puzzle Solving スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 972ms 898 0
Nemotron 3 Super 120b A12b 1.3 9.8 0.0% 0 8.39s 602 2,151
ツール呼び出し スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.39s 782 0
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 39.75s 270 1,969

クイック比較

比較ペアを切り替え