AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Hunter Alpha

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-17

Метрика	GPT-5.4 Mini GPT-5.4 Mini medium Релиз: 2026-03-17	Hunter Alpha Hunter Alpha medium Релиз: Дата релиза неизвестна

Метрика	GPT-5.4 Mini GPT-5.4 Mini medium Релиз: 2026-03-17	Hunter Alpha Hunter Alpha medium Релиз: Дата релиза неизвестна
Ранг	#34	#35
Оценка	7.1	7.0
Стабильность	7.2	7.2
Стоимость за результат	3.610	0.000
Общая стоимость	$0.289	$0.000
Тестов верно
Доля успешных попыток	68.6%	68.6%
Нестабильные тесты	6	6
Всего запусков	51	51
Выходные токены	1,708	4,724
Токены рассуждений	58,019	17,921
Время ответа (среднее)	15.66s	10.33s
Время ответа (макс.)	102.91s	30.53s
Время ответа (суммарно)	266.14s	175.60s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.4 Mini	8.6	7.9	91.7%	1		4.05s	296	2,876
Hunter Alpha	7.3	5.8	83.3%	2		4.75s	479	1,103

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.4 Mini	10.0	10.0	100.0%	0		17.81s	317	4,317
Hunter Alpha	4.7	1.6	66.7%	1		30.53s	792	3,456

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.4 Mini	10.0	10.0	100.0%	0		2.43s	234	650
Hunter Alpha	10.0	10.0	100.0%	0		23.16s	1,488	8,017

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.4 Mini	4.1	4.4	44.5%	2		65.31s	60	43,286
Hunter Alpha	3.0	10.0	0.0%	0		10.52s	892	2,406

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.4 Mini	4.5	10.0	0.0%	0		3.72s	150	510
Hunter Alpha	7.0	3.7	66.7%	1		6.44s	116	260

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.4 Mini	7.4	6.5	66.7%	1		2.50s	129	1,337
Hunter Alpha	9.9	10.0	100.0%	0		4.18s	208	465

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.4 Mini	6.8	7.9	55.6%	1		4.33s	271	2,449
Hunter Alpha	6.1	4.7	66.7%	2		5.36s	441	1,310

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.4 Mini	4.7	1.6	66.7%	1		9.62s	251	2,594
Hunter Alpha	10.0	10.0	100.0%	0		17.33s	308	904

Быстрое сравнение

Сменить пару сравнения

Claude Sonnet 4.6nonevsGPT-5.4 Minimedium Hunter AlphamediumvsQwen3.5 Plus 2026-02-15none Hunter AlphamediumvsGLM 5none Claude Sonnet 4.6nonevsHunter Alphamedium GPT-5.4 MinimediumvsQwen3.5 Plus 2026-02-15none GPT-5.4 MinimediumvsGLM 5none GPT-5.3 ChatnonevsHunter Alphamedium DeepSeek V3.2nonevsHunter Alphamedium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.4 Minimedium DeepSeek V3.2nonevsGPT-5.4 Minimedium GPT-5.2 ChatnonevsHunter Alphamedium Gemini 3.1 Flash Lite PreviewnonevsHunter Alphamedium