Qwen3.5 Plus 2026-04-20 (medium) vs Grok 4.3 (medium)

Qwen3.5 Plus 2026-04-20 (medium) лидирует по среднему баллу: 7.2 vs 7.1. Qwen3.5 Plus 2026-04-20 (medium) имеет более низкую стоимость benchmark: $0.317 vs $0.779. Qwen3.5 Plus 2026-04-20 (medium) быстрее: 46.36s vs 47.45s, с долей успешных попыток 63.6% vs 68.2%.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Ранг: #78
Общее число выходных токенов: 168,893
Время ответа (среднее): 46.36s
Общая стоимость: $0.317

Ранг: #81
Общее число выходных токенов: 241,421
Время ответа (среднее): 47.45s
Общая стоимость: $0.779

Рекомендуемая модель Qwen3.5 Plus 2026-04-20 (medium)

Здесь у него лучший балл (7.2), при этом он примерно в 2.5 раза дешевле, чем Grok 4.3 (medium).

Подробное сравнение

Метрика	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 medium Релиз: 2026-04-20	Grok 4.3 Grok 4.3 medium Релиз: 2026-05-01

Метрика	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 medium Релиз: 2026-04-20	Grok 4.3 Grok 4.3 medium Релиз: 2026-05-01
Оценка	7.2	7.1
Ранг	#78	#81
Надежность	9.6	10.0
Стабильность	9.0	8.6
Тестов верно
Доля успешных попыток	63.6%	68.2%
Нестабильные тесты	2	4
Всего запусков	66	66
Стоимость за результат	3.023	5.990
Общая стоимость	$0.317	$0.779
Цена входа	$0.300 / 1M	$1.250 / 1M
Цена выхода	$1.800 / 1M	$2.500 / 1M
Общее число входных токенов	42,097	140,031
Выходные токены	2,280	13,739
Токены рассуждений	166,613	227,682
Время ответа (среднее)	46.36s	47.45s
Время ответа (макс.)	189.38s	216.69s
Время ответа (суммарно)	973.57s	1043.83s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#78 Qwen3.5 Plus 2026-04-20

medium

Стоимость: $0.008
Время: 76.7s
Токены: 4,355 tok

#81 xAI: Grok 4.3

medium

Стоимость: $0.009
Время: 19.0s
Токены: 3,661 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		10.84s	672	215	7,748
Grok 4.3	10.0	10.0	100.0%	0		8.83s	2,010	88	8,207

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-04-20	6.2	8.7	33.3%	0		125.25s	7,630	308	58,682
Grok 4.3	5.9	7.7	44.4%	1		41.23s	8,340	1,028	31,226

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-04-20	6.5	10.0	50.0%	0		92.41s	14,934	483	17,490
Grok 4.3	6.5	10.0	50.0%	0		55.07s	108,468	11,992	21,601

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		38.32s	7,782	270	14,668
Grok 4.3	10.0	10.0	100.0%	0		18.97s	7,761	180	9,546

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-04-20	2.9	7.2	11.1%	1		53.10s	771	63	28,414
Grok 4.3	5.3	7.2	44.4%	1		181.74s	1,764	14	111,300

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-04-20	4.9	9.6	0.0%	0		25.30s	516	125	4,792
Grok 4.3	5.4	2.5	66.7%	1		24.70s	825	70	5,020

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		20.25s	699	103	7,689
Grok 4.3	9.8	10.0	100.0%	0		18.58s	1,362	57	8,713

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-04-20	8.2	7.2	88.9%	1		17.67s	696	338	9,800
Grok 4.3	5.9	7.2	55.6%	1		22.52s	1,689	128	14,468

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		14.72s	8,193	348	2,164
Grok 4.3	10.0	10.0	100.0%	0		17.66s	7,263	168	4,615

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5 Plus 2026-04-20	3.0	10.0	0.0%	0		92.57s	204	27	15,166
Grok 4.3	3.0	10.0	0.0%	0		44.47s	549	14	12,986

Быстрое сравнение

Сменить пару сравнения

Qwen3.7 PlusnonevsGrok 4.3medium KAT-Coder-Pro V2.5highvsQwen3.5 Plus 2026-04-20medium Qwen3.5 Plus 2026-04-20mediumvsStep 3.7 Flashlow Claude Opus 4.8nonevsQwen3.5 Plus 2026-04-20medium KAT-Coder-Pro V2.5highvsGrok 4.3medium Step 3.7 FlashlowvsGrok 4.3medium Claude Opus 4.8nonevsGrok 4.3medium Gemini 3.5 FlashnonevsGrok 4.3medium Claude Sonnet 4.6nonevsQwen3.5 Plus 2026-04-20medium KAT-Coder-Pro V2.5lowvsQwen3.5 Plus 2026-04-20medium Gemini 3 Flash PreviewlowvsQwen3.5 Plus 2026-04-20medium Gemini 3.5 FlashnonevsQwen3.5 Plus 2026-04-20medium