Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs OpenAI: GPT-5 Nano

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-08

Метрика Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite none Релиз: 2026-05-08 GPT-5 Nano GPT-5 Nano medium Релиз: 2025-08-07
Оценка 6.7 6.2
Ранг #73 #83
Надежность 10.0 10.0
Стабильность 8.4 7.0
Тестов верно
Доля успешных попыток 57.9% 57.9%
Нестабильные тесты 4 7
Всего запусков 57 57
Стоимость за результат 0.123 0.856
Общая стоимость $0.012 $0.069
???? ????? $0.250 / 1M $0.050 / 1M
???? ?????? $1.500 / 1M $0.400 / 1M
Выходные токены 2,454 5,214
Токены рассуждений 0 162,432
Время ответа (среднее) 1.11s 42.13s
Время ответа (макс.) 2.97s 204.02s
Время ответа (суммарно) 21.13s 505.59s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 7.5 8.4 66.7% 1 1.07s 639 0
GPT-5 Nano 6.5 7.9 58.3% 1 25.50s 1,221 21,184
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.59s 636 0
GPT-5 Nano 6.7 3.5 66.7% 1 40.73s 480 12,992
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.73s 357 0
GPT-5 Nano 10.0 10.0 100.0% 0 65.96s 578 17,984
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 843ms 279 0
GPT-5 Nano 3.7 1.7 50.0% 2 21.42s 453 10,560
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 762ms 15 0
GPT-5 Nano 5.2 4.4 55.6% 2 204.02s 237 64,448
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 992ms 63 0
GPT-5 Nano 4.1 10.0 0.0% 0 17.51s 202 4,608
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 859ms 72 0
GPT-5 Nano 9.8 10.0 100.0% 0 11.90s 382 4,096
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 6.3 4.8 66.7% 2 720ms 150 0
GPT-5 Nano 5.3 7.2 44.4% 1 19.81s 869 13,440
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 2.97s 234 0
GPT-5 Nano 10.0 10.0 100.0% 0 33.30s 558 6,976
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 733ms 9 0
GPT-5 Nano 3.0 10.0 0.0% 0 20.13s 234 6,144

Быстрое сравнение

Сменить пару сравнения