Qwen3.7 Plus vs Grok 4.3 (medium)

Рекомендуемая модель Qwen3.7 Plus

Здесь у него лучший балл (7.2), при этом он примерно в 7.3 раза дешевле, чем Grok 4.3 (medium).

Подробное сравнение

Метрика	Qwen3.7 Plus Qwen3.7 Plus none Релиз: 2026-06-03	Grok 4.3 Grok 4.3 medium Релиз: 2026-05-01

Метрика	Qwen3.7 Plus Qwen3.7 Plus none Релиз: 2026-06-03	Grok 4.3 Grok 4.3 medium Релиз: 2026-05-01
Оценка	7.2	7.1
Ранг	#81	#83
Надежность	10.0	10.0
Стабильность	10.0	8.6
Тестов верно
Доля успешных попыток	50.0%	68.2%
Нестабильные тесты	0	4
Всего запусков	66	66
Стоимость за результат	1.014	5.990
Общая стоимость	$0.106	$0.779
Цена входа	$0.320 / 1M	$1.250 / 1M
Цена выхода	$1.280 / 1M	$2.500 / 1M
Общее число входных токенов	98,824	140,031
Выходные токены	58,097	13,739
Токены рассуждений	0	227,682
Время ответа (среднее)	12.09s	47.45s
Время ответа (макс.)	206.03s	216.69s
Время ответа (суммарно)	265.89s	1043.83s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.7 Plus	6.5	10.0	50.0%	0		1.38s	696	349	0
Grok 4.3	10.0	10.0	100.0%	0		8.83s	2,010	88	8,207

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.7 Plus	5.5	10.0	33.3%	0		2.15s	7,911	639	0
Grok 4.3	5.9	7.7	44.4%	1		41.23s	8,340	1,028	31,226

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.7 Plus	10.0	10.0	100.0%	0		117.70s	71,266	56,024	0
Grok 4.3	6.5	10.0	50.0%	0		55.07s	108,468	11,992	21,601

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.7 Plus	10.0	10.0	100.0%	0		1.43s	7,794	243	0
Grok 4.3	10.0	10.0	100.0%	0		18.97s	7,761	180	9,546

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.7 Plus	3.0	10.0	0.0%	0		868ms	789	18	0
Grok 4.3	5.3	7.2	44.4%	1		181.74s	1,764	14	111,300

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.7 Plus	5.3	10.0	0.0%	0		1.33s	522	78	0
Grok 4.3	5.4	2.5	66.7%	1		24.70s	825	70	5,020

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.7 Plus	6.3	10.0	50.0%	0		929ms	711	72	0
Grok 4.3	9.8	10.0	100.0%	0		18.58s	1,362	57	8,713

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.7 Plus	7.7	10.0	66.7%	0		1.71s	714	443	0
Grok 4.3	5.9	7.2	55.6%	1		22.52s	1,689	128	14,468

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.7 Plus	10.0	10.0	100.0%	0		3.54s	8,211	222	0
Grok 4.3	10.0	10.0	100.0%	0		17.66s	7,263	168	4,615

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.7 Plus	3.0	10.0	0.0%	0		1.21s	210	9	0
Grok 4.3	3.0	10.0	0.0%	0		44.47s	549	14	12,986

Сменить пару сравнения