AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs Qwen: Qwen3.6 35B A3B

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-27

Метрика	Claude Opus 4.7 Claude Opus 4.7 medium Релиз: 2026-04-16	Qwen3.6 35B A3B Qwen3.6 35B A3B none Релиз: 2026-04-20

Метрика	Claude Opus 4.7 Claude Opus 4.7 medium Релиз: 2026-04-16	Qwen3.6 35B A3B Qwen3.6 35B A3B none Релиз: 2026-04-20
Оценка	9.2	5.1
Ранг	#3	#112
Надежность	Н/Д	10.0
Стабильность	10.0	7.4
Тестов верно
Доля успешных попыток	88.9%	39.6%
Нестабильные тесты	0	5
Всего запусков	54	54
Стоимость за результат	2.790	0.471
Общая стоимость	$0.447	$0.019
???? ?????	$5.000 / 1M	$0.162 / 1M
???? ??????	$25.000 / 1M	$0.966 / 1M
Выходные токены	5,375	17,503
Токены рассуждений	1,341	0
Время ответа (среднее)	3.53s	2.87s
Время ответа (макс.)	21.45s	12.46s
Время ответа (суммарно)	60.03s	46.00s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	348	0
Qwen3.6 35B A3B	3.6	7.6	16.7%	1		2.10s	1,571	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		6.41s	1,141	257
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		2.05s	921	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		21.45s	2,369	1,084
Qwen3.6 35B A3B	0.0	0.0	0.0%	0		0ms	0	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	324	0
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		1.46s	248	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	51	0
Qwen3.6 35B A3B	3.5	4.4	33.3%	2		7.45s	11,381	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	256	0
Qwen3.6 35B A3B	4.4	3.0	33.3%	1		3.51s	1,545	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	114	0
Qwen3.6 35B A3B	6.2	5.8	66.7%	1		1.86s	1,264	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		2.51s	399	0
Qwen3.6 35B A3B	3.2	9.9	0.0%	0		1.00s	573	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	373	0
Qwen3.6 35B A3B	0.0	0.0	0.0%	0		0ms	0	0

Быстрое сравнение

Сменить пару сравнения

Elephant AlphamediumvsQwen3.6 35B A3Bnone MiniMax M2.7mediumvsQwen3.6 35B A3Bnone Claude Opus 4.7mediumvsGPT-5.5low Claude Opus 4.7mediumvsGemini 3 Flash Previewlow Qwen3.6 35B A3BnonevsGLM 4.7 Flashmedium Mistral Small 4mediumvsQwen3.6 35B A3Bnone MiniMax M2.5mediumБесплатно доступноvsQwen3.6 35B A3Bnone Claude Opus 4.7mediumvsHY3 PreviewhighБесплатно доступно gpt-oss-120bmediumБесплатно доступноvsQwen3.6 35B A3Bnone Claude Opus 4.7mediumvsHY3 PreviewlowБесплатно доступно Claude Opus 4.7mediumvsGemini 3 Flash Previewnone Claude Opus 4.7mediumvsGemini 3.1 Flash Lite Previewlow