Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs OpenAI: GPT-5.4 Nano

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-19

Метрика Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite low Релиз: 2026-05-08 GPT-5.4 Nano GPT-5.4 Nano medium Релиз: 2026-03-17
Оценка 7.6 7.3
Ранг #49 #58
Надежность 10.0 10.0
Стабильность 9.2 9.1
Тестов верно
Доля успешных попыток 68.4% 64.9%
Нестабильные тесты 2 2
Всего запусков 57 57
Стоимость за результат 0.203 0.761
Общая стоимость $0.025 $0.084
???? ????? $0.250 / 1M $0.200 / 1M
???? ?????? $1.500 / 1M $1.250 / 1M
Выходные токены 2,702 3,016
Токены рассуждений 8,596 59,306
Время ответа (среднее) 1.92s 10.87s
Время ответа (макс.) 5.66s 94.06s
Время ответа (суммарно) 36.49s 206.61s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 7.3 6.2 75.0% 2 1.84s 1,013 1,548
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 683 2,254
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.46s 441 408
GPT-5.4 Nano 10.0 10.0 100.0% 0 13.41s 472 3,616
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 4.48s 348 975
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 349 5,719
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.44s 291 697
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 234 516
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 5.3 10.0 33.3% 0 1.52s 15 1,214
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 60 43,325
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 1.37s 69 438
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 179 443
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.52s 72 760
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 95 521
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.40s 210 1,191
GPT-5.4 Nano 3.7 7.1 22.2% 1 3.65s 640 1,356
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 5.66s 234 945
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 234 382
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 1.46s 9 420
GPT-5.4 Nano 3.0 10.0 0.0% 0 4.81s 70 1,174

Быстрое сравнение

Сменить пару сравнения