AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Elephant Alpha

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-01

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	Elephant Alpha Elephant Alpha medium Релиз: 2026-04-14

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	Elephant Alpha Elephant Alpha medium Релиз: 2026-04-14
Оценка	5.6	5.4
Ранг	#120	#128
Надежность	10.0	Н/Д
Стабильность	8.3	9.6
Тестов верно
Доля успешных попыток	41.7%	33.3%
Нестабильные тесты	6	1
Всего запусков	60	60
Стоимость за результат	0.222	0.000
Общая стоимость	$0.018	$0.000
Цена входа	$0.252 / 1M	$0.000 / 1M
Цена выхода	$0.378 / 1M	$0.000 / 1M
Выходные токены	11,159	2,596
Токены рассуждений	0	0
Время ответа (среднее)	14.43s	1.27s
Время ответа (макс.)	115.89s	3.70s
Время ответа (суммарно)	288.55s	22.82s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.2	8.2	8.3%	1		9.35s	1,073	0
Elephant Alpha	6.6	10.0	50.0%	0		1.19s	815	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.1	5.4	16.7%	1		20.87s	4,522	0
Elephant Alpha	4.0	6.7	16.7%	1		1.30s	365	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
Elephant Alpha	3.0	10.0	0.0%	0		3.70s	562	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
Elephant Alpha	6.5	10.0	50.0%	0		979ms	246	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	2.9	6.9	11.1%	1		4.17s	21	0
Elephant Alpha	3.0	10.0	0.0%	0		925ms	24	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.8	10.0	66.7%	1		9.32s	43	0
Elephant Alpha	4.3	10.0	0.0%	0		920ms	105	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
Elephant Alpha	9.8	10.0	100.0%	0		987ms	82	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	8.3	10.0	77.8%	1		6.91s	298	0
Elephant Alpha	5.3	10.0	33.3%	0		868ms	166	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
Elephant Alpha	3.0	10.0	0.0%	0		2.83s	231	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	17	0
Elephant Alpha	0.0	0.0	0.0%	0		0ms	0	0

Быстрое сравнение

Сменить пару сравнения

Elephant AlphamediumvsQwen3.5-122B-A10Bnone Elephant AlphamediumvsGrok 4.20none gpt-oss-120bnoneБесплатно доступноvsElephant Alphamedium Elephant AlphamediumvsGLM 5 Turbonone Kimi K2.5nonevsElephant Alphamedium Ling-2.6-flashnonevsElephant Alphamedium DeepSeek V3.2nonevsMiniMax M2.5medium Elephant AlphamediumvsQwen3.6 Flashnone DeepSeek V3.2nonevsMistral Small 4medium Kimi K2.6noneБесплатно доступноvsElephant Alphamedium CobuddymediumvsDeepSeek V3.2none Elephant AlphamediumvsMiMo-V2.5-Pronone