AI BENCHY
比較する
❤️ Made by XCS

モデル名

Google: Gemini 3 Flash Preview

ベンチマークは Aibenchy テストスイートから次の日時に生成 : 2026/02/19

指標 Google: Gemini 3 Flash Preview
順位#10
企業Google
Score 6.25
一貫性 8.60
結果あたりのコスト 0.0754
合計コスト $0.00528
正解テスト 7/12
試行ごとの合格率 66.7%
不安定なテスト 2
出力トークン 485
推論トークン 0

カテゴリ内訳

カテゴリ 完全合格テスト Score 一貫性 試行ごとの合格率 不安定なテスト 推論スコア コスト
Anti-AI Tricks 1/2 5.50 10.00 50.0% 0 - $0.00016
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 - $0.00357
Domain specific 2/3 7.00 10.00 66.7% 0 - $0.00038
Instructions following 1/2 5.50 5.81 66.7% 1 - $0.00054
Puzzle Solving 2/3 7.00 10.00 66.7% 0 - $0.00066

比較対象モデル

Google: Gemini 3 Flash Preview と比較...

#9 · MoonshotAI

MoonshotAI: Kimi K2.5

推論(medium)

Score: 6.42

一貫性: 8.00

試行ごとの合格率: 72.2%

不安定なテスト: 3

結果あたりのコスト: 2.4097

正解テスト: 7/12

合計コスト: $0.16868

比較する

#11 · OpenAI

OpenAI: GPT-5 Nano

推論(medium)

Score: 5.92

一貫性: 6.03

試行ごとの合格率: 72.2%

不安定なテスト: 6

結果あたりのコスト: 0.4675

正解テスト: 6/12

合計コスト: $0.02806

比較する

#8 · X Ai

xAI: Grok 4.1 Fast

推論(medium)

Score: 6.42

一貫性: 8.60

試行ごとの合格率: 66.7%

不安定なテスト: 2

結果あたりのコスト: 0.4800

正解テスト: 7/12

合計コスト: $0.03360

比較する

クイック比較

Google: Gemini 3 Flash Preview と比較...