Навигация
AI BENCHY
Сравнить Графики
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Google: Gemini 3 Flash Preview vs OpenAI: GPT-5.4

Сравнить:

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-05

Метрика Google: Gemini 3 Flash Preview medium Релиз: 2025-12-17 OpenAI: GPT-5.4 none Релиз: 2026-03-05
Ранг #1 #44
Средний балл 10.0 4.6
Тестов верно
Стабильность 10.0 8.9
Стоимость за результат 1.064 1.496
Общая стоимость $0.160 $0.090
Доля успешных попыток 100.0% 44.4%
Нестабильные тесты 0 2
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
Выходные токены 1,523 1,635
Токены рассуждений 46,622 0
Время ответа (среднее) 13.39s 1.46s
Время ответа (макс.) 50.16s 2.89s
Время ответа (суммарно) 107.12s 21.86s

Лучшие модели по оценке

Время ответа (среднее)

Оценка vs общая стоимость

Средний балл vs Время ответа (среднее)

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.61s 299 3,127
OpenAI: GPT-5.4 10.0 7.3 11.1% 1 1.41s 388 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 50.16s 351 12,645
OpenAI: GPT-5.4 10.0 10.0 0.0% 0 2.89s 291 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Flash Preview 9.9 10.0 100.0% 0 4.72s 279 5,333
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 1.04s 222 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 21.12s 12 14,908
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 1.07s 50 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.10s 72 4,558
OpenAI: GPT-5.4 5.5 10.0 50.0% 0 1.07s 81 0
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.43s 276 4,921
OpenAI: GPT-5.4 4.0 9.8 33.3% 0 1.52s 357 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Google: Gemini 3 Flash Preview 10.0 10.0 100.0% 0 10.55s 234 1,130
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0

Быстрое сравнение

Сменить пару сравнения