AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs Hunter Alpha

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-15

Метрика	GPT-5.3 Chat GPT-5.3 Chat none Релиз: 2026-03-03	Hunter Alpha Hunter Alpha medium Релиз: Дата релиза неизвестна

Метрика	GPT-5.3 Chat GPT-5.3 Chat none Релиз: 2026-03-03	Hunter Alpha Hunter Alpha medium Релиз: Дата релиза неизвестна
Ранг	#23	#32
Оценка	7.8	7.1
Стабильность	8.5	7.6
Стоимость за результат	3.163	0.000
Общая стоимость	$0.317	$0.000
Тестов верно
Доля успешных попыток	70.8%	68.8%
Нестабильные тесты	3	5
Всего запусков	48	48
Выходные токены	19,272	4,686
Токены рассуждений	0	17,821
Время ответа (среднее)	5.96s	10.71s
Время ответа (макс.)	18.33s	30.53s
Время ответа (суммарно)	95.30s	171.41s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.3 Chat	7.9	7.5	77.8%	1		4.72s	3,091	0
Hunter Alpha	8.2	7.2	88.9%	1		4.93s	441	1,003

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.3 Chat	10.0	10.0	100.0%	0		11.96s	2,614	0
Hunter Alpha	4.7	1.6	66.7%	1		30.53s	792	3,456

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.21s	942	0
Hunter Alpha	10.0	10.0	100.0%	0		23.16s	1,488	8,017

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.3 Chat	3.5	4.4	33.3%	2		13.01s	8,264	0
Hunter Alpha	3.0	10.0	0.0%	0		10.52s	892	2,406

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.3 Chat	4.6	10.0	0.0%	0		1.99s	319	0
Hunter Alpha	7.0	3.7	66.7%	1		6.44s	116	260

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.3 Chat	8.3	10.0	50.0%	0		3.29s	1,455	0
Hunter Alpha	9.9	10.0	100.0%	0		4.18s	208	465

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.93s	1,726	0
Hunter Alpha	6.1	4.7	66.7%	2		5.36s	441	1,310

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.3 Chat	10.0	10.0	100.0%	0		8.36s	861	0
Hunter Alpha	10.0	10.0	100.0%	0		17.33s	308	904

Быстрое сравнение

Сменить пару сравнения

GPT-5.3 ChatnonevsQwen3.5-Flashmedium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsGrok 4.20 Betamedium GPT-5.3 ChatnonevsStep 3.5 FlashmediumБесплатно доступно GPT-5.3 ChatnonevsGLM 5 Turbomedium GPT-5.3 ChatnonevsMiMo-V2-Flashmedium Hunter AlphamediumvsQwen3.5 Plus 2026-02-15none Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.3 Chatnone Seed-2.0-MinimediumvsGPT-5.3 Chatnone Gemini 2.5 FlashmediumvsGPT-5.3 Chatnone Hunter AlphamediumvsGLM 5none DeepSeek V3.2mediumvsGPT-5.3 Chatnone