Qwen: Qwen3.5-27B vs Qwen: Qwen3.7 Max

Средний балл практически равен: 7.4 vs 7.4. Qwen3.7 Max имеет более низкую стоимость benchmark: $0.197 vs $1.627. Qwen3.7 Max быстрее: 4.52s vs 111.94s, с долей успешных попыток 72.7% vs 68.2%.

Рекомендуемая модельQwen3.7 MaxЗдесь у него лучший балл (7.4), при этом он примерно в 8.3 раза дешевле, чем Qwen3.5-27B (medium).

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-18

Метрика	Qwen3.5-27B Qwen3.5-27B medium Релиз: 2026-02-24	Qwen3.7 Max Qwen3.7 Max none Релиз: 2026-05-22

Метрика	Qwen3.5-27B Qwen3.5-27B medium Релиз: 2026-02-24	Qwen3.7 Max Qwen3.7 Max none Релиз: 2026-05-22
Оценка	7.4	7.4
Ранг	#58	#59
Надежность	10.0	9.9
Стабильность	8.2	10.0
Тестов верно
Доля успешных попыток	72.7%	68.2%
Нестабильные тесты	5	0
Всего запусков	66	66
Стоимость за результат	8.324	1.582
Общая стоимость	$1.627	$0.197
Цена входа	$0.260 / 1M	$1.475 / 1M
Цена выхода	$2.600 / 1M	$4.425 / 1M
Общее число входных токенов	111,635	95,983
Выходные токены	15,999	12,446
Токены рассуждений	598,430	0
Время ответа (среднее)	111.94s	4.52s
Время ответа (макс.)	1026.43s	72.30s
Время ответа (суммарно)	2462.67s	99.52s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#58 Qwen3.5-27B

medium

Стоимость: $0.008
Время: 62.0s
Токены: 3,099 tok

#59 Qwen3.7 Max

none

Стоимость: $0.046
Время: 195.0s
Токены: 12,171 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-27B	8.7	7.9	91.7%	1		19.75s	672	569	31,505
Qwen3.7 Max	6.5	10.0	50.0%	0		1.08s	696	242	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-27B	6.2	7.1	55.6%	1		160.69s	7,895	6,381	89,388
Qwen3.7 Max	5.5	10.0	33.3%	0		1.35s	7,911	582	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-27B	7.3	5.8	83.3%	1		595.19s	84,417	7,948	279,132
Qwen3.7 Max	6.5	10.0	50.0%	0		37.23s	68,425	10,623	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-27B	10.0	10.0	100.0%	0		30.26s	7,782	270	16,150
Qwen3.7 Max	10.0	10.0	100.0%	0		1.35s	7,794	243	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-27B	5.3	10.0	33.3%	0		79.53s	553	43	52,368
Qwen3.7 Max	7.7	10.0	66.7%	0		975ms	789	15	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-27B	6.1	3.1	66.7%	1		101.41s	524	70	23,147
Qwen3.7 Max	10.0	10.0	100.0%	0		1.04s	522	120	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-27B	10.0	10.0	100.0%	0		19.66s	699	97	11,638
Qwen3.7 Max	10.0	10.0	100.0%	0		943ms	711	72	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-27B	8.2	7.7	77.8%	1		59.60s	696	242	70,096
Qwen3.7 Max	10.0	10.0	100.0%	0		1.13s	714	314	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-27B	10.0	10.0	100.0%	0		7.45s	8,193	348	1,323
Qwen3.7 Max	10.0	10.0	100.0%	0		3.92s	8,211	222	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Qwen3.5-27B	3.0	10.0	0.0%	0		85.11s	204	31	23,683
Qwen3.7 Max	3.0	10.0	0.0%	0		856ms	210	13	0

Быстрое сравнение

Сменить пару сравнения

GPT-5.6 TerralowvsQwen3.5-27Bmedium GPT-5.4 MinimediumvsQwen3.7 Maxnone GPT-5.6 TerralowvsQwen3.7 Maxnone Gemini 3 Flash PreviewlowvsQwen3.7 Maxnone GPT-5.3 ChatnonevsQwen3.5-27Bmedium Gemini 3 Flash PreviewlowvsQwen3.5-27Bmedium KAT-Coder-Pro V2.5lowvsQwen3.7 Maxnone KAT-Coder-Pro V2.5lowvsQwen3.5-27Bmedium GPT-5.4 NanomediumvsQwen3.7 Maxnone Kimi K2.7 CodemediumvsQwen3.7 Maxnone Claude Sonnet 4.6nonevsQwen3.5-27Bmedium Nemotron 3 UltramediumБесплатно доступноvsQwen3.7 Maxnone