AI BENCHY
比較する
❤️ Made by XCS

モデル名

Google: Gemini 3.1 Pro Preview

ベンチマークは Aibenchy テストスイートから次の日時に生成 : 2026/02/19

指標 Google: Gemini 3.1 Pro Preview
順位#2
企業Google
Score 9.25
一貫性 10.00
結果あたりのコスト 2.5543
合計コスト $0.28097
正解テスト 11/12
試行ごとの合格率 91.7%
不安定なテスト 0
出力トークン 632
推論トークン 21,277

カテゴリ内訳

カテゴリ 完全合格テスト Score 一貫性 試行ごとの合格率 不安定なテスト 推論スコア コスト
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 5.75 $0.02289
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.50 $0.05541
Domain specific 2/3 7.00 10.00 66.7% 0 5.63 $0.12975
Instructions following 2/2 10.00 10.00 100.0% 0 5.67 $0.03134
Puzzle Solving 3/3 10.00 10.00 100.0% 0 8.89 $0.04159

比較対象モデル

Google: Gemini 3.1 Pro Preview と比較...

#1 · Google

Google: Gemini 3 Flash Preview

推論(medium)

Score: 9.92

一貫性: 10.00

試行ごとの合格率: 100.0%

不安定なテスト: 0

結果あたりのコスト: 0.8502

正解テスト: 12/12

合計コスト: $0.10203

比較する

#3 · Google

Google: Gemini 3 Pro Preview

推論(medium)

Score: 8.42

一貫性: 10.00

試行ごとの合格率: 83.3%

不安定なテスト: 0

結果あたりのコスト: 0.8028

正解テスト: 10/12

合計コスト: $0.08029

比較する

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

推論(medium)

Score: 8.42

一貫性: 9.30

試行ごとの合格率: 86.1%

不安定なテスト: 1

結果あたりのコスト: 2.3151

正解テスト: 10/12

合計コスト: $0.23151

比較する

クイック比較

Google: Gemini 3.1 Pro Preview と比較...