Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

HY3 Preview vs xAI: Grok 4.3

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-01

Метрика HY3 Preview HY3 Preview high Релиз: 2026-04-22 Бесплатно доступно Grok 4.3 Grok 4.3 medium Релиз: 2026-05-01
Оценка 8.6 8.2
Ранг #10 #20
Надежность Н/Д 10.0
Стабильность 9.2 8.6
Тестов верно
Доля успешных попыток 83.3% 81.5%
Нестабильные тесты 2 3
Всего запусков 50 54
Стоимость за результат 0.000 3.974
Общая стоимость $0.000 $0.517
???? ????? $0.000 / 1M $1.250 / 1M
???? ?????? $0.000 / 1M $2.500 / 1M
Выходные токены 238,920 1,223
Токены рассуждений 0 187,047
Время ответа (среднее) 55.19s 48.63s
Время ответа (макс.) 149.94s 216.69s
Время ответа (суммарно) 938.23s 875.27s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
HY3 Preview 10.0 10.0 100.0% 0 32.69s 26,550 0
Grok 4.3 10.0 10.0 100.0% 0 8.83s 88 8,207
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
HY3 Preview 10.0 10.0 100.0% 0 99.76s 38,167 0
Grok 4.3 10.0 10.0 100.0% 0 45.72s 284 9,659
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
HY3 Preview 10.0 10.0 100.0% 0 113.09s 31,319 0
Grok 4.3 10.0 10.0 100.0% 0 63.99s 234 15,301
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
HY3 Preview 6.5 10.0 50.0% 0 12.11s 4,323 0
Grok 4.3 10.0 10.0 100.0% 0 18.97s 180 9,546
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
HY3 Preview 5.3 7.2 44.4% 1 109.04s 87,559 0
Grok 4.3 5.3 7.2 44.4% 1 181.74s 14 111,300
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
HY3 Preview 10.0 10.0 100.0% 0 24.31s 5,490 0
Grok 4.3 5.4 2.5 66.7% 1 24.70s 70 5,020
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
HY3 Preview 9.9 10.0 100.0% 0 34.02s 13,331 0
Grok 4.3 9.8 10.0 100.0% 0 18.58s 57 8,713
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
HY3 Preview 9.0 7.9 88.9% 1 28.07s 21,811 0
Grok 4.3 5.9 7.2 55.6% 1 22.53s 128 14,686
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
HY3 Preview 10.0 10.0 100.0% 0 78.83s 10,370 0
Grok 4.3 10.0 10.0 100.0% 0 17.66s 168 4,615

Быстрое сравнение

Сменить пару сравнения