#36
Gemini 2.5 Flash
Google · リリース: 2025-06-17 · google/gemini-2.5-flash::none
平均スコア
5.34
結果あたりのコスト
0.107
一貫性
9.40
合計コスト
$0.007
正解テスト
6
テストは、その全実行が合格した場合にのみ完全合格とみなされます。
誤答テスト数
8
試行ごとの合格率: 47.6%
不安定なテスト
1
応答時間: 平均 698ms · 合計 9.78s · 最大 1.91s
不正解: 6
指示に従っていない: 2
スコア上位モデル
最初のモデルを選択し、次に2つ目のモデルをクリックして並列比較ページを開きます。
クイック比較
Gemini 2.5 FlashnonevsMiniMax M2.5mediumGemini 2.5 FlashnonevsQwen3.5-122B-A10BnoneGemini 2.5 Flashnonevsgpt-oss-120bmedium無料で利用可能Gemini 2.5 FlashnonevsGPT-4o-mininoneGemini 2.5 FlashnonevsGPT-5 MinimediumGemini 2.5 FlashnonevsDeepSeek V3.2noneGemini 2.5 FlashnonevsGemini 3 Flash PreviewmediumGemini 2.5 FlashnonevsGemini 3.1 Pro PreviewmediumGemini 2.5 FlashnonevsStep 3.5 Flashmedium無料で利用可能
カテゴリ内訳
| カテゴリ | 平均スコア | 一貫性 | 正解テスト |
|---|---|---|---|
| Anti-AI Tricks | 1.00 | 10.00 | 0/3 |
| Data parsing and extraction | 9.88 | 10.00 | 2/2 |
| Domain specific | 4.00 | 7.21 | 1/3 |
| Instructions following | 8.00 | 9.99 | 1/2 |
| Puzzle Solving | 4.67 | 10.00 | 1/3 |
| Tool Calling | 10.00 | 10.00 | 1/1 |