AI BENCHY Compare

Elephant Alpha vs xAI: Grok 4.20

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-29

Метрика	Elephant Alpha Elephant Alpha medium Релиз: 2026-04-14	Grok 4.20 Grok 4.20 none Релиз: 2026-03-31

Метрика	Elephant Alpha Elephant Alpha medium Релиз: 2026-04-14	Grok 4.20 Grok 4.20 none Релиз: 2026-03-31
Оценка	5.4	5.4
Ранг	#127	#125
Надежность	Н/Д	Н/Д
Стабильность	9.6	10.0
Тестов верно
Доля успешных попыток	33.3%	33.3%
Нестабильные тесты	1	0
Всего запусков	60	54
Стоимость за результат	0.000	1.570
Общая стоимость	$0.000	$0.095
Цена входа	$0.000 / 1M	$1.250 / 1M
Цена выхода	$0.000 / 1M	$2.500 / 1M
Выходные токены	2,596	1,923
Токены рассуждений	0	0
Время ответа (среднее)	1.27s	1.11s
Время ответа (макс.)	3.70s	6.04s
Время ответа (суммарно)	22.82s	19.96s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant Alpha	6.6	10.0	50.0%	0		1.19s	815	0
Grok 4.20	4.8	10.0	25.0%	0		501ms	267	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant Alpha	4.0	6.7	16.7%	1		1.30s	365	0
Grok 4.20	3.4	9.3	0.0%	0		1.22s	312	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant Alpha	3.0	10.0	0.0%	0		3.70s	562	0
Grok 4.20	3.0	10.0	0.0%	0		6.04s	282	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant Alpha	6.5	10.0	50.0%	0		979ms	246	0
Grok 4.20	10.0	10.0	100.0%	0		522ms	207	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant Alpha	3.0	10.0	0.0%	0		925ms	24	0
Grok 4.20	3.0	10.0	0.0%	0		687ms	325	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant Alpha	4.3	10.0	0.0%	0		920ms	105	0
Grok 4.20	4.8	10.0	0.0%	0		659ms	83	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant Alpha	9.8	10.0	100.0%	0		987ms	82	0
Grok 4.20	6.3	10.0	50.0%	0		445ms	60	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant Alpha	5.3	10.0	33.3%	0		868ms	166	0
Grok 4.20	5.3	10.0	33.3%	0		473ms	198	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant Alpha	3.0	10.0	0.0%	0		2.83s	231	0
Grok 4.20	10.0	10.0	100.0%	0		4.63s	189	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant Alpha	0.0	0.0	0.0%	0		0ms	0	0
Grok 4.20	-	-	-	-	-	-	-	-

Быстрое сравнение

Сменить пару сравнения

MiniMax M2.5mediumБесплатно доступноvsGrok 4.20none Elephant AlphamediumvsQwen3.5-122B-A10Bnone Mistral Small 4mediumvsGrok 4.20none MiniMax M2.7mediumvsGrok 4.20none gpt-oss-120bnoneБесплатно доступноvsElephant Alphamedium Elephant AlphamediumvsGLM 5 Turbonone Kimi K2.5nonevsElephant Alphamedium Ling-2.6-flashnonevsElephant Alphamedium Elephant AlphamediumvsQwen3.6 Flashnone Elephant AlphamediumvsMiMo-V2.5-Pronone GPT-5.4nonevsElephant Alphamedium Kimi K2.6noneБесплатно доступноvsElephant Alphamedium