Claude Opus 4.7 (medium) vs Qwen3.6 Max Preview (medium)

Claude Opus 4.7 (medium) лидирует по среднему баллу: 8.7 vs 8.4. Qwen3.6 Max Preview (medium) имеет более низкую стоимость benchmark: $1.143 vs $1.477. Claude Opus 4.7 (medium) быстрее: 7.61s vs 67.53s, с долей успешных попыток 83.3% vs 80.3%.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Ранг: #20
Общее число выходных токенов: 29,990
Время ответа (среднее): 7.61s
Общая стоимость: $1.477

Ранг: #25
Общее число выходных токенов: 169,940
Время ответа (среднее): 67.53s
Общая стоимость: $1.143

Рекомендуемая модель Claude Opus 4.7 (medium)

Здесь у него лучший балл (8.7), и он отвечает примерно в 8.9 раза быстрее, чем Qwen3.6 Max Preview (medium).

Подробное сравнение

Метрика	Claude Opus 4.7 Claude Opus 4.7 medium Релиз: 2026-04-16	Qwen3.6 Max Preview Qwen3.6 Max Preview medium Релиз: 2026-04-20

Метрика	Claude Opus 4.7 Claude Opus 4.7 medium Релиз: 2026-04-16	Qwen3.6 Max Preview Qwen3.6 Max Preview medium Релиз: 2026-04-20
Оценка	8.7	8.4
Ранг	#20	#25
Надежность	10.0	9.9
Стабильность	9.6	8.9
Тестов верно
Доля успешных попыток	83.3%	80.3%
Нестабильные тесты	1	3
Всего запусков	66	66
Стоимость за результат	8.201	8.173
Общая стоимость	$1.477	$1.143
Цена входа	$5.000 / 1M	$1.040 / 1M
Цена выхода	$25.000 / 1M	$6.240 / 1M
Общее число входных токенов	145,252	79,240
Выходные токены	24,948	5,098
Токены рассуждений	5,042	164,842
Время ответа (среднее)	7.61s	67.53s
Время ответа (макс.)	65.40s	238.07s
Время ответа (суммарно)	159.91s	1485.64s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#20 Claude Opus 4.7

medium

Стоимость: $0.059
Время: 26.8s
Токены: 2,475 tok

#25 Qwen3.6 Max Preview

medium

Стоимость: $0.024
Время: 76.5s
Токены: 3,861 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	894	348	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		22.13s	672	228	10,075

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	7.6	7.2	77.8%	1		12.96s	10,635	7,629	1,114
Qwen3.6 Max Preview	8.8	7.8	88.9%	1		146.48s	7,895	427	52,957

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		43.42s	104,347	15,459	3,928
Qwen3.6 Max Preview	7.3	5.8	83.3%	1		177.48s	51,812	3,215	35,050

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	10,533	324	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		41.15s	7,782	270	10,106

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	630	51	0
Qwen3.6 Max Preview	2.9	7.2	11.1%	1		95.91s	771	60	30,371

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	723	256	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		32.24s	516	129	3,510

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	939	114	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		24.31s	699	103	5,848

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		2.43s	939	370	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		24.32s	696	329	7,693

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	15,339	373	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		18.32s	8,193	309	1,571

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.7	3.0	10.0	0.0%	0		2.25s	273	24	0
Qwen3.6 Max Preview	3.0	10.0	0.0%	0		60.56s	204	28	7,661

Быстрое сравнение

Сменить пару сравнения