Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs OpenAI: GPT-5.4 Nano

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-17

Метрика Gemini 3 Flash Preview Gemini 3 Flash Preview low Релиз: 2025-12-17 GPT-5.4 Nano GPT-5.4 Nano medium Релиз: 2026-03-17
Ранг #3 #28
Оценка 8.7 7.4
Стабильность 9.5 9.0
Стоимость за результат 0.577 0.769
Общая стоимость $0.081 $0.077
Тестов верно
Доля успешных попыток 84.3% 66.7%
Нестабильные тесты 1 2
Всего запусков 51 51
Выходные токены 1,592 2,474
Токены рассуждений 20,556 54,516
Время ответа (среднее) 5.95s 11.08s
Время ответа (макс.) 14.72s 94.06s
Время ответа (суммарно) 101.19s 188.39s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.48s 281 3,082
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 683 2,254
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 3.0 10.0 0.0% 0 3.27s 326 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 349 5,719
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 9.40s 279 3,656
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 234 516
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 5.3 7.2 44.4% 1 8.05s 12 6,410
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 60 43,325
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.68s 120 981
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 179 443
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 9.9 10.0 100.0% 0 7.02s 71 2,752
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 95 521
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.11s 269 3,260
GPT-5.4 Nano 4.0 7.1 22.2% 1 3.65s 640 1,356
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.99s 234 415
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 234 382

Быстрое сравнение

Сменить пару сравнения