AI BENCHY
Сравнить Графики
❤️ Made by XCS
Your ad here

#16

Gemini 2.5 Flash

Google · Релиз: 2025-06-17 · google/gemini-2.5-flash::medium

Средний балл

7.06

Стоимость за результат

2.762

Стабильность

9.39

Общая стоимость

$0.249

Тестов верно

9

Тест считается полностью пройденным, только если все его прогоны успешны.

Ошибочных тестов

5

Доля успешных попыток: 69.1%

Нестабильные тесты

1

Время ответа: среднее 11.74s · суммарно 164.33s · макс. 95.48s

Неверный ответ: 4 Не соблюдены инструкции: 1

Лучшие модели по оценке

Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.

Быстрое сравнение

Разбивка по категориям

Категория Средний балл Стабильность Тестов верно
Anti-AI Tricks 7.34 10.00 2/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 4.00 7.21 1/3
Instructions following 7.00 9.91 1/2
Puzzle Solving 7.00 10.00 2/3
Tool Calling 10.00 10.00 1/1