AI BENCHY Compare

Hunter Alpha vs xAI: Grok 4.20 Beta

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-12

Метрика	Hunter Alpha Hunter Alpha medium Релиз: Дата релиза неизвестна	Grok 4.20 Beta Grok 4.20 Beta none Релиз: 2026-03-12

Метрика	Hunter Alpha Hunter Alpha medium Релиз: Дата релиза неизвестна	Grok 4.20 Beta Grok 4.20 Beta none Релиз: 2026-03-12
Ранг	#35	#52
Средний балл	5.9	4.4
Стабильность	7.6	9.1
Стоимость за результат	0.000	2.214
Общая стоимость	$0.000	$0.089
Тестов верно
Доля успешных попыток	68.8%	33.3%
Нестабильные тесты	5	2
Всего запусков	48	48
Выходные токены	4,686	1,511
Токены рассуждений	17,821	0
Время ответа (среднее)	10.71s	1.22s
Время ответа (макс.)	30.53s	6.48s
Время ответа (суммарно)	171.41s	19.53s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Средний балл vs Время ответа (среднее)

Общее число выходных токенов

Средний балл vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	7.0	7.2	88.9%	1		4.93s	441	1,003
Grok 4.20 Beta	3.3	7.9	22.2%	1		562ms	245	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	10.0	1.6	66.7%	1		30.53s	792	3,456
Grok 4.20 Beta	10.0	10.0	0.0%	0		6.48s	282	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	9.9	10.0	100.0%	0		23.16s	1,488	8,017
Grok 4.20 Beta	9.9	10.0	100.0%	0		601ms	197	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	10.0	10.0	0.0%	0		10.52s	892	2,406
Grok 4.20 Beta	10.0	10.0	0.0%	0		611ms	160	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	8.0	3.7	66.7%	1		6.44s	116	260
Grok 4.20 Beta	5.0	10.0	0.0%	0		541ms	87	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	9.5	10.0	100.0%	0		4.18s	208	465
Grok 4.20 Beta	4.5	10.0	0.0%	0		687ms	60	0

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	4.3	4.7	66.7%	2		5.36s	441	1,310
Grok 4.20 Beta	4.0	7.2	55.6%	1		541ms	291	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Hunter Alpha	10.0	10.0	100.0%	0		17.33s	308	904
Grok 4.20 Beta	10.0	10.0	100.0%	0		4.79s	189	0

Быстрое сравнение

Сменить пару сравнения

Hunter AlphamediumvsGLM 5none MiniMax M2.5mediumvsGrok 4.20 Betanone Hunter AlphamediumvsQwen3.5 Plus 2026-02-15none DeepSeek V3.2nonevsHunter Alphamedium gpt-oss-120bmediumБесплатно доступноvsGrok 4.20 Betanone Hunter AlphamediumvsQwen3.5-Flashnone Gemini 2.5 FlashnonevsHunter Alphamedium Claude Sonnet 4.6nonevsHunter Alphamedium Mercury 2mediumvsGrok 4.20 Betanone Qwen3 Coder NextmediumvsGrok 4.20 Betanone Hunter AlphamediumvsQwen3.5-122B-A10Bnone Seed-2.0-LitenonevsHunter Alphamedium