Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.4 Nano

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-17

Метрика Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Релиз: 2026-03-03 GPT-5.4 Nano GPT-5.4 Nano medium Релиз: 2026-03-17
Ранг #23 #28
Оценка 7.8 7.4
Стабильность 9.6 9.0
Стоимость за результат 0.131 0.769
Общая стоимость $0.015 $0.077
Тестов верно
Доля успешных попыток 68.6% 66.7%
Нестабильные тесты 1 2
Всего запусков 51 51
Выходные токены 4,721 2,474
Токены рассуждений 0 54,516
Время ответа (среднее) 1.29s 11.08s
Время ответа (макс.) 3.39s 94.06s
Время ответа (суммарно) 21.95s 188.39s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 7.5 8.4 66.7% 1 1.04s 1,092 0
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 683 2,254
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 3.20s 339 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 349 5,719
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.22s 399 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 234 516
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 942ms 568 0
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 60 43,325
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 741ms 69 0
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 179 443
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.13s 574 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 95 521
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 972ms 898 0
GPT-5.4 Nano 4.0 7.1 22.2% 1 3.65s 640 1,356
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.39s 782 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 234 382

Быстрое сравнение

Сменить пару сравнения