Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.2 vs OpenAI: GPT-5.4 Mini

Сводка

Сравнение benchmark GPT-5.2 vs GPT-5.4 Mini: GPT-5.2 лидирует по среднему баллу: 8.4 vs 8.0. GPT-5.4 Mini имеет более низкую стоимость benchmark: $0.526 vs $0.548. GPT-5.2 быстрее: 16.88s vs 22.34s, с долей успешных попыток 71.4% vs 73.0%.

Рекомендуемая модель: GPT-5.2 - У него самый высокий балл в этом сравнении (8.4) и лучший общий баланс стоимости и времени ответа среди всех 2 моделей.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-12

Метрика GPT-5.2 GPT-5.2 medium Релиз: 2025-12-11 GPT-5.4 Mini GPT-5.4 Mini medium Релиз: 2026-03-17
Оценка 8.4 8.0
Ранг #25 #30
Надежность 10.0 10.0
Стабильность 8.4 8.0
Тестов верно
Доля успешных попыток 71.4% 73.0%
Нестабильные тесты 4 5
Всего запусков 63 63
Стоимость за результат 4.209 4.381
Общая стоимость $0.548 $0.526
Цена входа $1.750 / 1M $0.750 / 1M
Цена выхода $14.000 / 1M $4.500 / 1M
Общее число входных токенов 33,967 34,116
Выходные токены 2,901 2,181
Токены рассуждений 31,932 108,937
Время ответа (среднее) 16.88s 22.34s
Время ответа (макс.) 77.80s 138.75s
Время ответа (суммарно) 236.34s 469.20s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#25 GPT-5.2

medium
Cost
$0.047
Time
49.2s
Tokens
3,396 tok

#30 GPT-5.4 Mini

medium
Cost
$0.056
Time
95.5s
Tokens
12,464 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.2 6.5 8.0 58.3% 1 7.81s 606 567 2,002
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 606 296 2,876
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.2 10.0 10.0 100.0% 0 22.73s 7,302 511 11,912
GPT-5.4 Mini 8.4 7.4 88.9% 1 57.87s 7,305 467 40,902
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.2 10.0 10.0 100.0% 0 14.06s 11,019 291 1,757
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 11,019 317 4,317
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.2 10.0 10.0 100.0% 0 3.15s 7,140 234 420
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 7,140 234 650
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.2 5.9 7.2 55.6% 1 77.80s 473 42 10,342
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 619 60 43,286
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.2 3.7 9.7 0.0% 0 4.32s 477 162 269
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 477 150 510
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.2 9.9 10.0 100.0% 0 3.12s 660 94 614
GPT-5.4 Mini 9.8 10.0 100.0% 0 2.13s 660 96 1,185
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.2 7.5 7.3 77.8% 1 5.80s 642 735 924
GPT-5.4 Mini 7.8 10.0 66.7% 0 4.37s 642 278 2,443
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.2 4.7 1.6 66.7% 1 10.30s 5,453 239 469
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 5,453 251 2,594
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
GPT-5.2 3.0 10.0 0.0% 0 28.18s 195 26 3,223
GPT-5.4 Mini 3.0 10.0 0.0% 0 30.10s 195 32 10,174

Быстрое сравнение

Сменить пару сравнения