AI BENCHY
Сравнить Графики
❤️ Made by XCS
Your ad here

#36

Gemini 2.5 Flash

Google · Релиз: 2025-06-17 · google/gemini-2.5-flash::none

Средний балл

5.34

Стоимость за результат

0.107

Стабильность

9.40

Общая стоимость

$0.007

Тестов верно

6

Тест считается полностью пройденным, только если все его прогоны успешны.

Ошибочных тестов

8

Доля успешных попыток: 47.6%

Нестабильные тесты

1

Время ответа: среднее 698ms · суммарно 9.78s · макс. 1.91s

Неверный ответ: 6 Не соблюдены инструкции: 2

Лучшие модели по оценке

Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.

Быстрое сравнение

Разбивка по категориям

Категория Средний балл Стабильность Тестов верно
Anti-AI Tricks 1.00 10.00 0/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 4.00 7.21 1/3
Instructions following 8.00 9.99 1/2
Puzzle Solving 4.67 10.00 1/3
Tool Calling 10.00 10.00 1/1