Claude Sonnet 4.6 (medium) vs DeepSeek V4 Pro (high)

Claude Sonnet 4.6 (medium) лидирует по среднему баллу: 7.8 vs 7.7. DeepSeek V4 Pro (high) имеет более низкую стоимость benchmark: $0.200 vs $2.057. Claude Sonnet 4.6 (medium) быстрее: 25.91s vs 79.14s, с долей успешных попыток 66.7% vs 63.6%.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-08-01

Ранг: #51
Общее число выходных токенов: 115,865
Время ответа (среднее): 25.91s
Общая стоимость: $2.057

Ранг: #58
Общее число выходных токенов: 189,181
Время ответа (среднее): 79.14s
Общая стоимость: $0.200

Рекомендуемая модель DeepSeek V4 Pro (high)

Его балл близок к лучшему здесь (7.7 против 7.8), при этом он примерно в 10.3 раза дешевле, чем Claude Sonnet 4.6 (medium).

Подробное сравнение

Метрика	Claude Sonnet 4.6 Claude Sonnet 4.6 medium Релиз: 2026-02-17	DeepSeek V4 Pro DeepSeek V4 Pro high Релиз: 2026-04-24

Метрика	Claude Sonnet 4.6 Claude Sonnet 4.6 medium Релиз: 2026-02-17	DeepSeek V4 Pro DeepSeek V4 Pro high Релиз: 2026-04-24
Оценка	7.8	7.7
Ранг	#51	#58
Надежность	10.0	10.0
Стабильность	9.2	7.7
Тестов верно
Доля успешных попыток	66.7%	63.6%
Нестабильные тесты	2	6
Всего запусков	66	66
Стоимость за результат	14.692	2.000
Общая стоимость	$2.057	$0.200
Цена входа	$3.000 / 1M	$0.435 / 1M
Цена выхода	$15.000 / 1M	$0.870 / 1M
Общее число входных токенов	106,292	90,748
Выходные токены	80,748	10,462
Токены рассуждений	35,117	178,719
Время ответа (среднее)	25.91s	79.14s
Время ответа (макс.)	140.96s	416.76s
Время ответа (суммарно)	362.78s	1740.97s

Генерация showcase моделей

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#51 Claude Sonnet 4.6

medium

Неверный SVG

Стоимость: $0.000
Время: 300.0s
Токены: 0 tok

#58 DeepSeek V4 Pro

high

Стоимость: $0.023
Время: 257.6s
Токены: 14,870 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	6.5	10.0	50.0%	0		2.98s	789	1,046	1,093
DeepSeek V4 Pro	5.7	5.9	58.3%	2		25.70s	536	149	3,214

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	5.7	6.6	44.4%	1		33.29s	6,995	16,089	3,686
DeepSeek V4 Pro	6.3	8.7	33.3%	0		243.00s	5,090	383	84,580

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	10.0	10.0	100.0%	0		93.65s	75,531	31,916	9,109
DeepSeek V4 Pro	10.0	10.0	100.0%	0		78.99s	66,082	4,582	25,404

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	10.0	10.0	100.0%	0		13.90s	8,676	649	742
DeepSeek V4 Pro	10.0	10.0	100.0%	0		25.03s	7,690	274	2,166

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	2.9	7.2	11.1%	1		0ms	471	25,790	16,919
DeepSeek V4 Pro	3.6	7.2	22.2%	1		151.46s	569	4,404	50,391

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.94s	564	256	433
DeepSeek V4 Pro	10.0	10.0	100.0%	0		8.83s	471	115	1,013

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	10.0	10.0	100.0%	0		2.61s	792	318	552
DeepSeek V4 Pro	7.8	6.6	83.3%	1		8.73s	627	66	2,726

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	10.0	10.0	100.0%	0		5.31s	816	592	646
DeepSeek V4 Pro	6.9	4.9	77.8%	2		56.85s	591	178	2,563

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	10.0	10.0	100.0%	0		7.48s	11,454	655	351
DeepSeek V4 Pro	9.8	10.0	100.0%	0		15.92s	8,909	295	701

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	3.0	10.0	0.0%	0		30.09s	204	3,437	1,586
DeepSeek V4 Pro	3.0	10.0	0.0%	0		34.01s	183	16	5,961

Быстрое сравнение

Сменить пару сравнения

Claude Sonnet 4.6mediumvsQwen3.7 Flashhigh Claude Opus 4.6mediumvsDeepSeek V4 Prohigh DeepSeek V4 ProhighvsMiniMax M3medium DeepSeek V4 ProhighvsGLM 5medium DeepSeek V4 ProhighvsGrok Build 0.1medium DeepSeek V4 ProhighvsGPT-5.6 Lunamedium Claude Opus 4.8lowvsDeepSeek V4 Prohigh DeepSeek V4 ProhighvsNemotron 3 UltramediumБесплатно доступно Claude Opus 5nonevsDeepSeek V4 Prohigh DeepSeek V4 ProhighvsKimi K2.7 Codemedium Claude Sonnet 4.6mediumvsGPT-5.6 Lunahigh Claude Sonnet 4.6mediumvsGPT-5.6 Terrahigh