AI BENCHY Compare

Qwen: Qwen3.5-122B-A10B vs Qwen: Qwen3.5 Plus 2026-04-20

Сводка

Сравнение benchmark Qwen3.5-122B-A10B (medium) vs Qwen3.5 Plus 2026-04-20 (medium): Средний балл практически равен: 7.7 vs 7.8. Qwen3.5 Plus 2026-04-20 (medium) имеет более низкую стоимость benchmark: $0.317 vs $0.588. Qwen3.5-122B-A10B (medium) быстрее: 42.49s vs 46.36s, с долей успешных попыток 73.0% vs 66.7%.

Рекомендуемая модель: Qwen3.5 Plus 2026-04-20 (medium) - Здесь у него лучший балл (7.8), при этом он примерно в 1.9 раза дешевле, чем Qwen3.5-122B-A10B (medium).

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-10

Метрика	Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium Релиз: 2026-02-24	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 medium Релиз: 2026-04-20

Метрика	Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium Релиз: 2026-02-24	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 medium Релиз: 2026-04-20
Оценка	7.7	7.8
Ранг	#45	#42
Надежность	10.0	10.0
Стабильность	8.8	9.0
Тестов верно
Доля успешных попыток	73.0%	66.7%
Нестабильные тесты	3	2
Всего запусков	63	63
Стоимость за результат	5.235	3.023
Общая стоимость	$0.588	$0.317
Цена входа	$0.260 / 1M	$0.300 / 1M
Цена выхода	$2.080 / 1M	$1.800 / 1M
Общее число входных токенов	41,832	42,097
Выходные токены	26,187	2,280
Токены рассуждений	251,028	166,613
Время ответа (среднее)	42.49s	46.36s
Время ответа (макс.)	168.16s	189.38s
Время ответа (суммарно)	892.30s	973.57s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#45 Qwen3.5-122B-A10B

medium

Стоимость: $0.019
Время: 48.7s
Токены: 6,034 tok

#42 Qwen3.5 Plus 2026-04-20

medium

Стоимость: $0.008
Время: 76.7s
Токены: 4,355 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		9.75s	672	269	16,835
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		10.84s	672	215	7,748

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-122B-A10B	6.0	7.2	55.6%	1		114.48s	7,630	8,057	82,578
Qwen3.5 Plus 2026-04-20	6.2	8.7	33.3%	0		125.25s	7,630	308	58,682

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		107.79s	14,947	483	11,337
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		92.41s	14,934	483	17,490

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		23.41s	7,782	270	16,558
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		38.32s	7,782	270	14,668

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-122B-A10B	2.9	7.2	11.1%	1		63.40s	771	15,537	64,889
Qwen3.5 Plus 2026-04-20	2.9	7.2	11.1%	1		53.10s	771	63	28,414

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-122B-A10B	3.4	2.2	33.3%	1		34.11s	344	66	7,592
Qwen3.5 Plus 2026-04-20	4.9	9.6	0.0%	0		25.30s	516	125	4,792

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		9.88s	593	77	7,372
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		20.25s	699	103	7,689

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		17.89s	696	284	27,575
Qwen3.5 Plus 2026-04-20	8.2	7.2	88.9%	1		17.67s	696	338	9,800

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		4.60s	8,193	322	1,226
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		14.72s	8,193	348	2,164

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		52.87s	204	822	15,066
Qwen3.5 Plus 2026-04-20	3.0	10.0	0.0%	0		92.57s	204	27	15,166

Быстрое сравнение

Сменить пару сравнения

Claude Opus 4.8lowvsQwen3.5-122B-A10Bmedium GPT-5.6 TerralowvsQwen3.5-122B-A10Bmedium Claude Opus 4.8lowvsQwen3.5 Plus 2026-04-20medium Qwen3.5 Plus 2026-04-20mediumvsGrok 4.5low Qwen3.5-122B-A10BmediumvsStep 3.7 Flashlow GPT-5.6 LunahighvsQwen3.5-122B-A10Bmedium GPT-5.6 TerralowvsQwen3.5 Plus 2026-04-20medium Qwen3.5-122B-A10BmediumvsGrok 4.5low Qwen3.5 Plus 2026-04-20mediumvsStep 3.7 Flashlow GPT-5.6 LunahighvsQwen3.5 Plus 2026-04-20medium DeepSeek V4 ProhighvsQwen3.5-122B-A10Bmedium DeepSeek V4 ProhighvsQwen3.5 Plus 2026-04-20medium