Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.5 Flash vs OpenAI: GPT-5 Nano

Сводка

Сравнение benchmark Gemini 3.5 Flash vs GPT-5 Nano: Gemini 3.5 Flash лидирует по среднему баллу: 6.8 vs 6.7. GPT-5 Nano имеет более низкую стоимость benchmark: $0.081 vs $0.108. Gemini 3.5 Flash быстрее: 1.57s vs 42.51s, с долей успешных попыток 68.3% vs 57.1%.

Рекомендуемая модель: Gemini 3.5 Flash - Здесь у него лучший балл (6.8), и он отвечает примерно в 27.0 раза быстрее, чем GPT-5 Nano.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-12

Метрика Gemini 3.5 Flash Gemini 3.5 Flash minimal Релиз: 2026-05-19 GPT-5 Nano GPT-5 Nano medium Релиз: 2025-08-07
Оценка 6.8 6.7
Ранг #71 #79
Надежность 10.0 10.0
Стабильность 9.6 7.3
Тестов верно
Доля успешных попыток 68.3% 57.1%
Нестабильные тесты 1 7
Всего запусков 63 63
Стоимость за результат 0.767 0.897
Общая стоимость $0.108 $0.081
Цена входа $1.500 / 1M $0.050 / 1M
Цена выхода $9.000 / 1M $0.400 / 1M
Общее число входных токенов 39,847 34,108
Выходные токены 5,277 5,464
Токены рассуждений 0 192,064
Время ответа (среднее) 1.57s 42.51s
Время ответа (макс.) 5.51s 204.02s
Время ответа (суммарно) 33.02s 595.09s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#71 Gemini 3.5 Flash

minimal
Cost
$0.041
Time
20.4s
Tokens
4,608 tok

#79 GPT-5 Nano

medium
Cost
$0.006
Time
108.5s
Tokens
13,209 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 6.5 10.0 50.0% 0 892ms 492 405 0
GPT-5 Nano 6.5 7.9 58.3% 1 25.50s 606 1,221 21,184
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 5.6 9.9 33.3% 0 2.75s 8,122 3,456 0
GPT-5 Nano 7.0 7.7 55.6% 1 41.62s 7,305 740 41,152
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 3.0 10.0 0.0% 0 3.56s 15,780 404 0
GPT-5 Nano 10.0 10.0 100.0% 0 65.96s 11,019 578 17,984
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.66s 7,548 279 0
GPT-5 Nano 3.7 1.7 50.0% 2 21.42s 7,140 453 10,560
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 899ms 633 12 0
GPT-5 Nano 5.2 4.4 55.6% 2 204.02s 619 237 64,448
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 922ms 486 117 0
GPT-5 Nano 4.1 10.0 0.0% 0 17.51s 477 202 4,608
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 6.4 5.8 66.7% 1 893ms 615 76 0
GPT-5 Nano 9.8 10.0 100.0% 0 15.64s 660 312 4,736
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.45s 558 282 0
GPT-5 Nano 5.3 7.2 44.4% 1 20.63s 642 929 14,272
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.79s 5,457 234 0
GPT-5 Nano 10.0 10.0 100.0% 0 33.30s 5,445 558 6,976
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Gemini 3.5 Flash 3.0 10.0 0.0% 0 1.76s 156 12 0
GPT-5 Nano 3.0 10.0 0.0% 0 20.13s 195 234 6,144

Быстрое сравнение

Сменить пару сравнения