Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Qwen: Qwen3.6 Max Preview

Сводка

Сравнение benchmark Claude Opus 4.6 vs Qwen3.6 Max Preview: Claude Opus 4.6 лидирует по среднему баллу: 7.0 vs 6.9. Qwen3.6 Max Preview имеет более низкую стоимость benchmark: $0.075 vs $2.053. Qwen3.6 Max Preview быстрее: 3.30s vs 25.89s, с долей успешных попыток 61.9% vs 58.7%.

Рекомендуемая модель: Qwen3.6 Max Preview - Его балл близок к лучшему здесь (6.9 против 7.0), при этом он примерно в 27.7 раза дешевле, чем Claude Opus 4.6.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-10

Метрика Claude Opus 4.6 Claude Opus 4.6 medium Релиз: 2026-02-05 Qwen3.6 Max Preview Qwen3.6 Max Preview none Релиз: 2026-04-20
Оценка 7.0 6.9
Ранг #70 #75
Надежность 10.0 10.0
Стабильность 8.8 9.2
Тестов верно
Доля успешных попыток 61.9% 58.7%
Нестабильные тесты 3 2
Всего запусков 63 63
Стоимость за результат 17.103 0.824
Общая стоимость $2.053 $0.075
Цена входа $5.000 / 1M $1.040 / 1M
Цена выхода $25.000 / 1M $6.240 / 1M
Общее число входных токенов 53,227 42,509
Выходные токены 47,446 4,779
Токены рассуждений 24,000 0
Время ответа (среднее) 25.89s 3.30s
Время ответа (макс.) 83.40s 20.51s
Время ответа (суммарно) 362.49s 69.40s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#70 Claude Opus 4.6

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

#75 Qwen3.6 Max Preview

none
Cost
$0.025
Time
83.9s
Tokens
4,066 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 840 986 1,071
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 696 513 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Opus 4.6 5.7 7.1 44.4% 1 30.10s 8,522 13,057 4,121
Qwen3.6 Max Preview 3.8 7.3 22.2% 1 3.12s 7,913 456 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 20,685 8,178 5,194
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 14,949 2,842 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 8,676 691 757
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 7,794 243 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 674 14,642 8,687
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 789 18 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 564 188 292
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 522 76 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 792 266 467
Qwen3.6 Max Preview 9.8 10.0 100.0% 0 1.40s 711 69 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Opus 4.6 7.7 10.0 66.7% 0 4.71s 816 532 630
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.65s 714 321 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 11,454 861 329
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 8,211 222 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Claude Opus 4.6 3.0 10.0 0.0% 0 63.24s 204 8,045 2,452
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 1.97s 210 19 0

Быстрое сравнение

Сменить пару сравнения