AI BENCHY Compare

Qwen: Qwen3.5-35B-A3B vs Grok 4.1 Fast

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-29

Метрика	Qwen3.5-35B-A3B Qwen3.5-35B-A3B none Релиз: 2026-02-24	Grok 4.1 Fast Grok 4.1 Fast medium Релиз: 2025-11-19

Метрика	Qwen3.5-35B-A3B Qwen3.5-35B-A3B none Релиз: 2026-02-24	Grok 4.1 Fast Grok 4.1 Fast medium Релиз: 2025-11-19
Оценка	5.8	6.5
Ранг	#110	#93
Надежность	10.0	10.0
Стабильность	8.9	7.3
Тестов верно
Доля успешных попыток	45.0%	61.4%
Нестабильные тесты	3	6
Всего запусков	60	57
Стоимость за результат	0.224	0.642
Общая стоимость	$0.016	$0.058
Цена входа	$0.139 / 1M	$0.000 / 1M
Цена выхода	$1.000 / 1M	$0.000 / 1M
Выходные токены	4,334	2,006
Токены рассуждений	0	96,334
Время ответа (среднее)	3.50s	23.85s
Время ответа (макс.)	47.43s	121.79s
Время ответа (суммарно)	70.00s	286.16s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	3.4	7.9	16.7%	1		1.43s	574	0
Grok 4.1 Fast	8.7	7.9	91.7%	1		3.81s	108	4,741

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	6.8	10.0	50.0%	0		1.72s	562	0
Grok 4.1 Fast	2.3	1.1	33.3%	1		23.58s	821	6,703

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	3.0	10.0	0.0%	0		47.43s	1,833	0
Grok 4.1 Fast	10.0	10.0	100.0%	0		37.64s	261	12,272

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		1.16s	243	0
Grok 4.1 Fast	10.0	10.0	100.0%	0		6.63s	180	5,409

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	7.7	10.0	66.7%	0		485ms	15	0
Grok 4.1 Fast	5.8	4.4	66.7%	2		121.79s	11	37,657

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	6.5	3.4	66.7%	1		1.19s	114	0
Grok 4.1 Fast	4.2	9.9	0.0%	0		16.25s	127	3,456

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	6.3	10.0	50.0%	0		809ms	63	0
Grok 4.1 Fast	6.5	10.0	50.0%	0		4.63s	54	3,326

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	3.7	7.4	22.2%	1		1.35s	655	0
Grok 4.1 Fast	5.3	7.2	44.4%	1		7.40s	169	5,904

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		2.30s	264	0
Grok 4.1 Fast	2.8	1.6	33.3%	1		27.71s	260	11,485

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Qwen3.5-35B-A3B	3.0	10.0	0.0%	0		493ms	11	0
Grok 4.1 Fast	3.0	10.0	0.0%	0		25.52s	15	5,381

Быстрое сравнение

Сменить пару сравнения

CobuddymediumvsQwen3.5-35B-A3Bnone Owl AlphamediumvsQwen3.5-35B-A3Bnone gpt-oss-120bmediumБесплатно доступноvsQwen3.5-35B-A3Bnone Nemotron 3 SupermediumБесплатно доступноvsQwen3.5-35B-A3Bnone GPT-5 NanomediumvsQwen3.5-35B-A3Bnone MiniMax M2.5mediumБесплатно доступноvsQwen3.5-35B-A3Bnone Mistral Small 4mediumvsQwen3.5-35B-A3Bnone Elephant AlphamediumvsQwen3.5-35B-A3Bnone MiniMax M2.7mediumvsQwen3.5-35B-A3Bnone Mercury 2mediumvsQwen3.5-35B-A3Bnone Kimi K2.5mediumvsQwen3.5-35B-A3Bnone Gemini 3.1 Flash LiteminimalvsQwen3.5-35B-A3Bnone