Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 2.5 Flash vs Google: Gemini 3.5 Flash

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-01

Метрика Gemini 2.5 Flash Gemini 2.5 Flash none Релиз: 2025-06-17 Gemini 3.5 Flash Gemini 3.5 Flash high Релиз: 2026-05-19
Оценка 6.4 9.6
Ранг #95 #2
Надежность 10.0 10.0
Стабильность 9.6 9.6
Тестов верно
Доля успешных попыток 48.3% 96.7%
Нестабильные тесты 1 1
Всего запусков 60 60
Стоимость за результат 0.159 5.231
Общая стоимость $0.015 $0.994
Цена входа $0.300 / 1M $1.500 / 1M
Цена выхода $2.500 / 1M $9.000 / 1M
Выходные токены 1,764 1,969
Токены рассуждений 0 102,679
Время ответа (среднее) 889ms 8.30s
Время ответа (макс.) 4.39s 34.82s
Время ответа (суммарно) 17.79s 165.92s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 3.0 10.0 0.0% 0 582ms 102 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.57s 174 4,997
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 6.8 10.0 50.0% 0 810ms 477 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 24.62s 450 34,170
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 3.0 10.0 0.0% 0 4.39s 366 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.37s 351 16,323
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 10.0 10.0 100.0% 0 652ms 279 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.43s 279 8,466
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 5.9 7.2 55.6% 1 495ms 12 0
Gemini 3.5 Flash 7.6 7.2 77.8% 1 14.09s 12 24,721
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 5.0 10.0 0.0% 0 615ms 78 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.63s 115 1,650
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 10.0 10.0 100.0% 0 590ms 72 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.35s 70 3,799
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 7.7 10.0 66.7% 0 604ms 132 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.23s 241 4,940
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.91s 234 0
Gemini 3.5 Flash 9.8 10.0 100.0% 0 4.96s 265 1,608
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 3.0 10.0 0.0% 0 1.15s 12 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.94s 12 2,005

Быстрое сравнение

Сменить пару сравнения