Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 2.5 Flash vs OpenAI: GPT-5 Nano

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-01

Метрика Gemini 2.5 Flash Gemini 2.5 Flash none Релиз: 2025-06-17 GPT-5 Nano GPT-5 Nano medium Релиз: 2025-08-07
Оценка 6.4 6.1
Ранг #95 #100
Надежность 10.0 10.0
Стабильность 9.6 7.1
Тестов верно
Доля успешных попыток 48.3% 55.0%
Нестабильные тесты 1 7
Всего запусков 60 60
Стоимость за результат 0.159 0.952
Общая стоимость $0.015 $0.077
Цена входа $0.300 / 1M $0.050 / 1M
Цена выхода $2.500 / 1M $0.400 / 1M
Выходные токены 1,764 5,328
Токены рассуждений 0 181,056
Время ответа (среднее) 889ms 43.52s
Время ответа (макс.) 4.39s 204.02s
Время ответа (суммарно) 17.79s 565.82s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 3.0 10.0 0.0% 0 582ms 102 0
GPT-5 Nano 6.5 7.9 58.3% 1 25.50s 1,221 21,184
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 6.8 10.0 50.0% 0 810ms 477 0
GPT-5 Nano 5.4 6.6 33.3% 1 47.80s 604 30,144
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 3.0 10.0 0.0% 0 4.39s 366 0
GPT-5 Nano 10.0 10.0 100.0% 0 65.96s 578 17,984
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 10.0 10.0 100.0% 0 652ms 279 0
GPT-5 Nano 3.7 1.7 50.0% 2 21.42s 453 10,560
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 5.9 7.2 55.6% 1 495ms 12 0
GPT-5 Nano 5.2 4.4 55.6% 2 204.02s 237 64,448
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 5.0 10.0 0.0% 0 615ms 78 0
GPT-5 Nano 4.1 10.0 0.0% 0 17.51s 202 4,608
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 10.0 10.0 100.0% 0 590ms 72 0
GPT-5 Nano 9.8 10.0 100.0% 0 15.64s 312 4,736
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 7.7 10.0 66.7% 0 604ms 132 0
GPT-5 Nano 5.3 7.2 44.4% 1 20.63s 929 14,272
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.91s 234 0
GPT-5 Nano 10.0 10.0 100.0% 0 33.30s 558 6,976
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 2.5 Flash 3.0 10.0 0.0% 0 1.15s 12 0
GPT-5 Nano 3.0 10.0 0.0% 0 20.13s 234 6,144

Быстрое сравнение

Сменить пару сравнения