AI BENCHY
比較する
❤️ Made by XCS

モデル名

Google: Gemini 3 Pro Preview

ベンチマークは Aibenchy テストスイートから次の日時に生成 : 2026/02/19

指標 Google: Gemini 3 Pro Preview
順位#3
企業Google
Score 8.42
一貫性 10.00
結果あたりのコスト 0.8028
合計コスト $0.08029
正解テスト 10/12
試行ごとの合格率 83.3%
不安定なテスト 0
出力トークン 645
推論トークン 4,539

カテゴリ内訳

カテゴリ 完全合格テスト Score 一貫性 試行ごとの合格率 不安定なテスト 推論スコア コスト
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 2.00 $0.00911
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 7.83 $0.02601
Domain specific 1/3 4.00 10.00 33.3% 0 2.44 $0.01599
Instructions following 2/2 9.50 10.00 100.0% 0 5.00 $0.01113
Puzzle Solving 3/3 10.00 10.00 100.0% 0 7.17 $0.01807

比較対象モデル

Google: Gemini 3 Pro Preview と比較...

#2 · Google

Google: Gemini 3.1 Pro Preview

推論(medium)

Score: 9.25

一貫性: 10.00

試行ごとの合格率: 91.7%

不安定なテスト: 0

結果あたりのコスト: 2.5543

正解テスト: 11/12

合計コスト: $0.28097

比較する

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

推論(medium)

Score: 8.42

一貫性: 9.30

試行ごとの合格率: 86.1%

不安定なテスト: 1

結果あたりのコスト: 2.3151

正解テスト: 10/12

合計コスト: $0.23151

比較する

#1 · Google

Google: Gemini 3 Flash Preview

推論(medium)

Score: 9.92

一貫性: 10.00

試行ごとの合格率: 100.0%

不安定なテスト: 0

結果あたりのコスト: 0.8502

正解テスト: 12/12

合計コスト: $0.10203

比較する

クイック比較

Google: Gemini 3 Pro Preview と比較...