AI BENCHY Compare

OpenAI: GPT-5.4 vs Hunter Alpha

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-12

Метрика	GPT-5.4 GPT-5.4 none Релиз: 2026-03-05	Hunter Alpha Hunter Alpha none Релиз: Дата релиза неизвестна

Метрика	GPT-5.4 GPT-5.4 none Релиз: 2026-03-05	Hunter Alpha Hunter Alpha none Релиз: Дата релиза неизвестна
Ранг	#51	#50
Средний балл	4.5	4.6
Стабильность	8.9	8.0
Стоимость за результат	1.562	0.000
Общая стоимость	$0.094	$0.000
Тестов верно
Доля успешных попыток	41.7%	52.1%
Нестабильные тесты	2	4
Всего запусков	48	48
Выходные токены	1,819	2,272
Токены рассуждений	0	0
Время ответа (среднее)	1.48s	4.64s
Время ответа (макс.)	2.89s	15.17s
Время ответа (суммарно)	23.64s	74.24s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Средний балл vs Время ответа (среднее)

Общее число выходных токенов

Средний балл vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.4	10.0	7.3	11.1%	1		1.41s	388	0
Hunter Alpha	1.3	7.4	22.2%	1		3.85s	773	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.4	10.0	10.0	0.0%	0		2.89s	291	0
Hunter Alpha	10.0	10.0	0.0%	0		15.17s	379	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.4	9.9	10.0	100.0%	0		1.04s	222	0
Hunter Alpha	9.9	10.0	100.0%	0		8.49s	249	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.4	4.0	7.2	44.4%	1		1.07s	50	0
Hunter Alpha	4.0	10.0	33.3%	0		2.33s	27	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.4	3.0	9.9	0.0%	0		1.78s	184	0
Hunter Alpha	5.0	3.1	66.7%	1		2.71s	91	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.4	5.5	10.0	50.0%	0		1.07s	81	0
Hunter Alpha	5.0	10.0	50.0%	0		2.82s	69	0

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.4	4.0	9.8	33.3%	0		1.52s	357	0
Hunter Alpha	4.0	4.4	66.7%	2		3.06s	349	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.4	10.0	10.0	100.0%	0		2.75s	246	0
Hunter Alpha	10.0	10.0	100.0%	0		6.02s	335	0

Быстрое сравнение

Сменить пару сравнения

MiniMax M2.5mediumvsHunter Alphanone MiniMax M2.5mediumvsGPT-5.4none Hunter AlphanonevsGrok 4.20 Multi-Agent Betamedium GPT-5.4nonevsGrok 4.20 Multi-Agent Betamedium gpt-oss-120bmediumБесплатно доступноvsHunter Alphanone Mercury 2mediumvsHunter Alphanone Mercury 2mediumvsGPT-5.4none Hunter AlphanonevsQwen3.5-35B-A3Bmedium GPT-5 NanomediumvsHunter Alphanone GPT-5.4nonevsQwen3 Coder Nextmedium GPT-5.4nonevsQwen3.5-35B-A3Bmedium Hunter AlphanonevsQwen3 Coder Nextmedium