AI BENCHY Compare

OpenAI: GPT-5.5 vs HY3 Preview

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-26

Метрика	GPT-5.5 GPT-5.5 low Релиз: 2026-04-24	HY3 Preview HY3 Preview high Релиз: 2026-04-22 Бесплатно доступно

Метрика	GPT-5.5 GPT-5.5 low Релиз: 2026-04-24	HY3 Preview HY3 Preview high Релиз: 2026-04-22 Бесплатно доступно
Оценка	9.0	8.5
Ранг	#5	#11
Надежность	10.0	Н/Д
Стабильность	9.6	8.8
Тестов верно
Доля успешных попыток	87.0%	81.5%
Нестабильные тесты	1	3
Всего запусков	54	50
Стоимость за результат	4.534	0.000
Общая стоимость	$0.681	$0.000
???? ?????	$5.000 / 1M	$0.000 / 1M
???? ??????	$30.000 / 1M	$0.000 / 1M
Выходные токены	1,959	238,920
Токены рассуждений	16,134	0
Время ответа (среднее)	8.39s	55.19s
Время ответа (макс.)	56.19s	149.94s
Время ответа (суммарно)	151.01s	938.23s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		4.15s	232	1,056
HY3 Preview	10.0	10.0	100.0%	0		32.69s	26,550	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		7.79s	369	936
HY3 Preview	10.0	10.0	100.0%	0		99.76s	38,167	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		9.56s	303	717
HY3 Preview	10.0	10.0	100.0%	0		113.09s	31,319	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		3.28s	228	157
HY3 Preview	6.5	10.0	50.0%	0		12.11s	4,323	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.5	5.3	10.0	33.3%	0		27.57s	69	11,731
HY3 Preview	5.3	7.2	44.4%	1		109.04s	87,559	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		3.45s	143	132
HY3 Preview	10.0	10.0	100.0%	0		24.31s	5,490	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.5	9.9	10.0	100.0%	0		2.98s	93	356
HY3 Preview	8.5	6.8	83.3%	1		34.02s	13,331	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.5	9.0	7.9	88.9%	1		4.48s	272	948
HY3 Preview	9.0	7.9	88.9%	1		28.07s	21,811	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
GPT-5.5	10.0	10.0	100.0%	0		4.96s	250	101
HY3 Preview	10.0	10.0	100.0%	0		78.83s	10,370	0

Быстрое сравнение

Сменить пару сравнения

Qwen3.5 Plus 2026-02-15mediumvsHY3 PreviewhighБесплатно доступно Qwen3.6 Plus PreviewmediumБесплатно доступноvsHY3 PreviewhighБесплатно доступно Qwen3.5-27BmediumvsHY3 PreviewhighБесплатно доступно GPT-5.3-CodexmediumvsHY3 PreviewhighБесплатно доступно Gemini 3 PRO PreviewmediumvsHY3 PreviewhighБесплатно доступно Seed-2.0-LitemediumvsHY3 PreviewhighБесплатно доступно HY3 PreviewhighБесплатно доступноvsGLM 5medium Claude Opus 4.7nonevsGPT-5.5low Gemma 4 31BmediumБесплатно доступноvsHY3 PreviewhighБесплатно доступно Claude Opus 4.7mediumvsGPT-5.5low Gemini 2.5 FlashmediumvsHY3 PreviewhighБесплатно доступно GPT-5.4mediumvsHY3 PreviewhighБесплатно доступно