#36
Gemini 2.5 Flash
Google · Релиз: 2025-06-17 · google/gemini-2.5-flash::none
Средний балл
5.34
Стоимость за результат
0.107
Стабильность
9.40
Общая стоимость
$0.007
Тестов верно
6
Тест считается полностью пройденным, только если все его прогоны успешны.
Ошибочных тестов
8
Доля успешных попыток: 47.6%
Нестабильные тесты
1
Время ответа: среднее 698ms · суммарно 9.78s · макс. 1.91s
Неверный ответ: 6
Не соблюдены инструкции: 2
Лучшие модели по оценке
Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.
Быстрое сравнение
Gemini 2.5 FlashnonevsMiniMax M2.5mediumGemini 2.5 FlashnonevsQwen3.5-122B-A10BnoneGemini 2.5 Flashnonevsgpt-oss-120bmediumБесплатно доступноGemini 2.5 FlashnonevsGPT-4o-mininoneGemini 2.5 FlashnonevsGPT-5 MinimediumGemini 2.5 FlashnonevsDeepSeek V3.2noneGemini 2.5 FlashnonevsGemini 3 Flash PreviewmediumGemini 2.5 FlashnonevsGemini 3.1 Pro PreviewmediumGemini 2.5 FlashnonevsStep 3.5 FlashmediumБесплатно доступно
Разбивка по категориям
| Категория | Средний балл | Стабильность | Тестов верно |
|---|---|---|---|
| Anti-AI Tricks | 1.00 | 10.00 | 0/3 |
| Data parsing and extraction | 9.88 | 10.00 | 2/2 |
| Domain specific | 4.00 | 7.21 | 1/3 |
| Instructions following | 8.00 | 9.99 | 1/2 |
| Puzzle Solving | 4.67 | 10.00 | 1/3 |
| Tool Calling | 10.00 | 10.00 | 1/1 |