Claude Opus 4.6 (medium) vs DeepSeek V4 Pro (high)

Средний балл практически равен: 7.7 vs 7.7. DeepSeek V4 Pro (high) имеет более низкую стоимость benchmark: $0.200 vs $3.059. Claude Opus 4.6 (medium) быстрее: 34.27s vs 79.14s, с долей успешных попыток 63.6% vs 63.6%.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-08-01

Ранг: #55
Общее число выходных токенов: 100,601
Время ответа (среднее): 34.27s
Общая стоимость: $3.059

Ранг: #58
Общее число выходных токенов: 189,181
Время ответа (среднее): 79.14s
Общая стоимость: $0.200

Рекомендуемая модель DeepSeek V4 Pro (high)

Здесь у него лучший балл (7.7), при этом он примерно в 15.3 раза дешевле, чем Claude Opus 4.6 (medium).

Подробное сравнение

Метрика	Claude Opus 4.6 Claude Opus 4.6 medium Релиз: 2026-02-05	DeepSeek V4 Pro DeepSeek V4 Pro high Релиз: 2026-04-24

Метрика	Claude Opus 4.6 Claude Opus 4.6 medium Релиз: 2026-02-05	DeepSeek V4 Pro DeepSeek V4 Pro high Релиз: 2026-04-24
Оценка	7.7	7.7
Ранг	#55	#58
Надежность	10.0	10.0
Стабильность	8.8	7.7
Тестов верно
Доля успешных попыток	63.6%	63.6%
Нестабильные тесты	3	6
Всего запусков	66	66
Стоимость за результат	23.524	2.000
Общая стоимость	$3.059	$0.200
Цена входа	$5.000 / 1M	$0.435 / 1M
Цена выхода	$25.000 / 1M	$0.870 / 1M
Общее число входных токенов	108,615	90,748
Выходные токены	72,286	10,462
Токены рассуждений	28,315	178,719
Время ответа (среднее)	34.27s	79.14s
Время ответа (макс.)	151.51s	416.76s
Время ответа (суммарно)	513.99s	1740.97s

Генерация showcase моделей

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#55 Claude Opus 4.6

medium

Неверный SVG

Стоимость: $0.000
Время: 300.0s
Токены: 0 tok

#58 DeepSeek V4 Pro

high

Стоимость: $0.023
Время: 257.6s
Токены: 14,870 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.6	6.4	5.8	66.7%	2		7.45s	840	986	1,071
DeepSeek V4 Pro	5.7	5.9	58.3%	2		25.70s	536	149	3,214

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.6	5.7	7.1	44.4%	1		30.10s	8,522	13,057	4,121
DeepSeek V4 Pro	6.3	8.7	33.3%	0		243.00s	5,090	383	84,580

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.6	10.0	10.0	100.0%	0		114.08s	76,073	33,018	9,509
DeepSeek V4 Pro	10.0	10.0	100.0%	0		78.99s	66,082	4,582	25,404

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.6	10.0	10.0	100.0%	0		7.37s	8,676	691	757
DeepSeek V4 Pro	10.0	10.0	100.0%	0		25.03s	7,690	274	2,166

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.6	3.0	10.0	0.0%	0		83.40s	674	14,642	8,687
DeepSeek V4 Pro	3.6	7.2	22.2%	1		151.46s	569	4,404	50,391

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.6	10.0	10.0	100.0%	0		5.04s	564	188	292
DeepSeek V4 Pro	10.0	10.0	100.0%	0		8.83s	471	115	1,013

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.6	10.0	10.0	100.0%	0		2.43s	792	266	467
DeepSeek V4 Pro	7.8	6.6	83.3%	1		8.73s	627	66	2,726

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.6	7.7	10.0	66.7%	0		4.71s	816	532	630
DeepSeek V4 Pro	6.9	4.9	77.8%	2		56.85s	591	178	2,563

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.6	10.0	10.0	100.0%	0		9.73s	11,454	861	329
DeepSeek V4 Pro	9.8	10.0	100.0%	0		15.92s	8,909	295	701

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Opus 4.6	3.0	10.0	0.0%	0		63.24s	204	8,045	2,452
DeepSeek V4 Pro	3.0	10.0	0.0%	0		34.01s	183	16	5,961

Быстрое сравнение

Сменить пару сравнения

Claude Opus 4.6mediumvsGPT-5.6 Lunahigh Claude Opus 4.6mediumvsDeepSeek V4 Flashhigh DeepSeek V4 ProhighvsMiniMax M3medium DeepSeek V4 ProhighvsGLM 5medium DeepSeek V4 ProhighvsGrok Build 0.1medium Claude Opus 4.6mediumvsQwen3.7 Flashhigh DeepSeek V4 ProhighvsGPT-5.6 Lunamedium Claude Opus 4.8lowvsDeepSeek V4 Prohigh DeepSeek V4 ProhighvsNemotron 3 UltramediumБесплатно доступно Claude Opus 5nonevsDeepSeek V4 Prohigh DeepSeek V4 ProhighvsKimi K2.7 Codemedium DeepSeek V4 ProhighvsGPT-5.4 Nanomedium