AI BENCHY Compare

Elephant Alpha vs Qwen: Qwen3.5-9B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-29

Метрика	Elephant Alpha Elephant Alpha none Релиз: 2026-04-14	Qwen3.5-9B Qwen3.5-9B medium Релиз: 2026-03-02

Метрика	Elephant Alpha Elephant Alpha none Релиз: 2026-04-14	Qwen3.5-9B Qwen3.5-9B medium Релиз: 2026-03-02
Оценка	5.2	4.2
Ранг	#136	#156
Надежность	Н/Д	5.0
Стабильность	9.6	7.9
Тестов верно
Доля успешных попыток	29.8%	28.3%
Нестабильные тесты	1	5
Всего запусков	60	60
Стоимость за результат	0.000	1.127
Общая стоимость	$0.000	$0.034
Цена входа	$0.000 / 1M	$0.040 / 1M
Цена выхода	$0.000 / 1M	$0.150 / 1M
Выходные токены	2,573	27,305
Токены рассуждений	0	199,780
Время ответа (среднее)	1.22s	83.32s
Время ответа (макс.)	3.81s	226.38s
Время ответа (суммарно)	22.03s	1249.74s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant Alpha	6.6	10.0	50.0%	0		963ms	610	0
Qwen3.5-9B	5.1	5.8	50.0%	2		34.44s	2,621	12,411

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant Alpha	4.7	6.7	33.3%	1		1.39s	375	0
Qwen3.5-9B	2.8	10.0	0.0%	0		135.61s	6,150	31,393

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant Alpha	3.0	10.0	0.0%	0		3.81s	731	0
Qwen3.5-9B	3.0	10.0	0.0%	0		0ms	0	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant Alpha	6.5	10.0	50.0%	0		1.04s	246	0
Qwen3.5-9B	3.6	5.6	33.3%	1		87.31s	1,383	32,113

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant Alpha	3.0	10.0	0.0%	0		927ms	24	0
Qwen3.5-9B	3.6	7.2	22.2%	1		137.75s	11,549	48,475

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant Alpha	4.0	10.0	0.0%	0		854ms	106	0
Qwen3.5-9B	2.8	1.6	33.3%	1		226.38s	0	30,695

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant Alpha	9.8	10.0	100.0%	0		1.03s	81	0
Qwen3.5-9B	6.5	10.0	50.0%	0		5.75s	491	1,824

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant Alpha	4.2	10.0	0.0%	0		807ms	170	0
Qwen3.5-9B	3.0	10.0	0.0%	0		32.27s	1,593	12,026

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant Alpha	3.0	10.0	0.0%	0		2.79s	230	0
Qwen3.5-9B	10.0	10.0	100.0%	0		4.31s	444	1,149

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Elephant Alpha	0.0	0.0	0.0%	0		0ms	0	0
Qwen3.5-9B	3.0	10.0	0.0%	0		177.02s	3,074	29,694

Быстрое сравнение

Сменить пару сравнения

Granite 4.1 8BnonevsQwen3.5-9Bmedium MiniMax M2.7mediumvsElephant Alphanone Mistral Small 4mediumvsElephant Alphanone MiniMax M2.5mediumБесплатно доступноvsElephant Alphanone Ling-2.6-1TnonevsQwen3.5-9Bmedium Mercury 2nonevsQwen3.5-9Bmedium Qwen3.5-9BmediumvsMiMo-V2-Flashnone CobuddymediumvsElephant Alphanone Elephant AlphanonevsQwen3 Coder Nextmedium GPT-5.4 NanononevsQwen3.5-9Bmedium Trinity Large PreviewnonevsQwen3.5-9Bmedium GPT-4o-mininonevsQwen3.5-9Bmedium