AI BENCHY
比較する
❤️ Made by XCS

モデル名

Google: Gemini 3 Flash Preview

ベンチマークは Aibenchy テストスイートから次の日時に生成 : 2026/02/19

指標 Google: Gemini 3 Flash Preview
順位#1
企業Google
Score 9.92
一貫性 10.00
結果あたりのコスト 0.8502
合計コスト $0.10203
正解テスト 12/12
試行ごとの合格率 100.0%
不安定なテスト 0
出力トークン 590
推論トークン 31,913

カテゴリ内訳

カテゴリ 完全合格テスト Score 一貫性 試行ごとの合格率 不安定なテスト 推論スコア コスト
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 7.17 $0.00544
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.17 $0.02077
Domain specific 3/3 10.00 10.00 100.0% 0 5.56 $0.04625
Instructions following 2/2 10.00 10.00 100.0% 0 5.50 $0.01281
Puzzle Solving 3/3 9.67 10.00 100.0% 0 6.50 $0.01679

比較対象モデル

Google: Gemini 3 Flash Preview と比較...

#2 · Google

Google: Gemini 3.1 Pro Preview

推論(medium)

Score: 9.25

一貫性: 10.00

試行ごとの合格率: 91.7%

不安定なテスト: 0

結果あたりのコスト: 2.5543

正解テスト: 11/12

合計コスト: $0.28097

比較する

#3 · Google

Google: Gemini 3 Pro Preview

推論(medium)

Score: 8.42

一貫性: 10.00

試行ごとの合格率: 83.3%

不安定なテスト: 0

結果あたりのコスト: 0.8028

正解テスト: 10/12

合計コスト: $0.08029

比較する

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

推論(medium)

Score: 8.42

一貫性: 9.30

試行ごとの合格率: 86.1%

不安定なテスト: 1

結果あたりのコスト: 2.3151

正解テスト: 10/12

合計コスト: $0.23151

比較する

クイック比較

Google: Gemini 3 Flash Preview と比較...