AI BENCHY
比較する
❤️ Made by XCS
Your ad here

モデル名

Google: Gemini 3 Flash Preview

推論(low)

ベンチマークは AI BENCHY テストスイートから次の日時に生成 : 2026/02/24

指標 Google: Gemini 3 Flash Preview
順位#5
企業Google
Score 8.23
一貫性 8.71
結果あたりのコスト 0.6173
合計コスト $0.06174
正解テスト
試行ごとの合格率 82.0%
不安定なテスト 2
出力トークン 936
推論トークン 18,071
応答時間(平均)6746ms
応答時間(合計)87697ms
応答時間(最大)14717ms

カテゴリ内訳

カテゴリ 完全合格テスト Score 一貫性 試行ごとの合格率 不安定なテスト 推論スコア 応答時間(平均) コスト
反AIトリック 10.00 10.00 100.0% 0 6.23 3496ms $0.00844
データ解析と抽出 10.00 10.00 100.0% 0 4.73 9460ms $0.01354
ドメイン特化 4.00 4.41 55.5% 2 1.83 8314ms $0.01993
指示追従 7.50 9.99 50.0% 0 5.00 7016ms $0.00878
Puzzle Solving 10.00 10.00 100.0% 0 7.50 6440ms $0.01105

比較対象モデル

Google: Gemini 3 Flash Preview と比較...

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

推論(medium)

Score: 8.54

一貫性: 9.35

試行ごとの合格率: 87.2%

不安定なテスト: 1

結果あたりのコスト: 2.1621

正解テスト:

合計コスト: $0.23784

比較する

#6 · OpenAI

OpenAI: GPT-5.3-Codex

推論(medium)

Score: 7.77

一貫性: 8.75

試行ごとの合格率: 76.9%

不安定なテスト: 2

結果あたりのコスト: 4.9342

正解テスト:

合計コスト: $0.44408

比較する

#3 · Google

Google: Gemini 3 Pro Preview

推論(medium)

Score: 8.54

一貫性: 10.00

試行ごとの合格率: 84.6%

不安定なテスト: 0

結果あたりのコスト: 0.7901

正解テスト:

合計コスト: $0.08692

比較する

クイック比較

Google: Gemini 3 Flash Preview と比較...