Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.5 vs HY3 Preview

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-24

Метрика GPT-5.5 GPT-5.5 medium Релиз: 2026-04-24 HY3 Preview HY3 Preview low Релиз: 2026-04-22 Бесплатно доступно
Оценка 9.0 8.1
Ранг #5 #24
Надежность Н/Д Н/Д
Стабильность 9.2 9.5
Тестов верно
Доля успешных попыток 87.0% 75.9%
Нестабильные тесты 2 1
Всего запусков 54 50
Стоимость за результат 19.226 0.000
Общая стоимость $2.884 $0.000
???? ????? $5.000 / 1M $0.000 / 1M
???? ?????? $30.000 / 1M $0.000 / 1M
Выходные токены 1,920 65,778
Токены рассуждений 89,632 0
Время ответа (среднее) 32.75s 23.98s
Время ответа (макс.) 332.10s 78.74s
Время ответа (суммарно) 589.59s 407.72s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 4.66s 250 1,335
HY3 Preview 10.0 10.0 100.0% 0 16.61s 7,905 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 9.09s 318 1,391
HY3 Preview 10.0 10.0 100.0% 0 27.94s 7,907 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 19.29s 312 2,841
HY3 Preview 10.0 10.0 100.0% 0 78.74s 12,975 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 4.18s 234 593
HY3 Preview 6.5 10.0 50.0% 0 5.85s 1,022 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.5 5.3 7.2 44.4% 1 164.14s 67 79,625
HY3 Preview 5.9 7.2 55.6% 1 40.44s 23,121 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 4.16s 138 223
HY3 Preview 10.0 10.0 100.0% 0 16.44s 2,185 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 3.36s 93 538
HY3 Preview 10.0 10.0 100.0% 0 15.98s 2,475 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.5 8.6 7.9 77.8% 1 6.78s 250 2,254
HY3 Preview 5.3 10.0 33.3% 0 13.73s 6,985 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
GPT-5.5 10.0 10.0 100.0% 0 10.57s 258 832
HY3 Preview 10.0 10.0 100.0% 0 17.84s 1,203 0

Быстрое сравнение

Сменить пару сравнения