Anthropic: Claude Sonnet 4.6 vs DeepSeek: DeepSeek V3.2

Claude Sonnet 4.6 лидирует по среднему баллу: 7.3 vs 7.0. DeepSeek V3.2 (medium) имеет более низкую стоимость benchmark: $0.078 vs $0.661. Claude Sonnet 4.6 быстрее: 8.12s vs 68.62s, с долей успешных попыток 57.6% vs 65.2%.

Рекомендуемая модельClaude Sonnet 4.6Здесь у него лучший балл (7.3), и он отвечает примерно в 8.5 раза быстрее, чем DeepSeek V3.2 (medium).

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-25

Метрика	Claude Sonnet 4.6 Claude Sonnet 4.6 none Релиз: 2026-02-17	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01

Метрика	Claude Sonnet 4.6 Claude Sonnet 4.6 none Релиз: 2026-02-17	DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01
Оценка	7.3	7.0
Ранг	#71	#84
Надежность	10.0	10.0
Стабильность	9.7	7.4
Тестов верно
Доля успешных попыток	57.6%	65.2%
Нестабильные тесты	1	7
Всего запусков	66	66
Стоимость за результат	5.502	0.671
Общая стоимость	$0.661	$0.078
Цена входа	$3.000 / 1M	$0.269 / 1M
Цена выхода	$15.000 / 1M	$0.400 / 1M
Общее число входных токенов	123,264	101,047
Выходные токены	19,362	11,834
Токены рассуждений	0	117,014
Время ответа (среднее)	8.12s	68.62s
Время ответа (макс.)	51.18s	376.10s
Время ответа (суммарно)	121.78s	1509.53s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#71 Claude Sonnet 4.6

none

Стоимость: $0.038
Время: 27.3s
Токены: 2,598 tok

#84 DeepSeek V3.2

medium

Стоимость: $0.001
Время: 53.6s
Токены: 1,932 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	4.8	10.0	25.0%	0		2.94s	636	1,214	0
DeepSeek V3.2	8.2	7.9	83.3%	1		24.23s	448	3,247	6,953

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	5.5	10.0	33.3%	0		5.19s	8,522	2,127	0
DeepSeek V3.2	6.0	7.2	55.6%	1		248.68s	5,717	649	52,014

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	9.8	10.0	100.0%	0		37.51s	91,402	13,663	0
DeepSeek V3.2	7.3	5.8	83.3%	1		79.92s	76,997	5,219	24,229

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	10.0	10.0	100.0%	0		3.43s	8,574	252	0
DeepSeek V3.2	10.0	10.0	100.0%	0		36.09s	7,388	207	7,693

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	7.7	10.0	66.7%	0		3.54s	759	413	0
DeepSeek V3.2	2.9	4.4	22.2%	2		24.27s	472	21	6,838

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	6.1	3.1	66.7%	1		2.56s	513	192	0
DeepSeek V3.2	3.4	2.5	33.3%	1		58.29s	314	49	2,189

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	6.5	10.0	50.0%	0		1.96s	690	90	0
DeepSeek V3.2	10.0	10.0	100.0%	0		35.78s	627	1,397	2,845

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	7.7	10.0	66.7%	0		2.53s	663	533	0
DeepSeek V3.2	7.0	7.2	55.6%	1		37.69s	594	518	6,375

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.11s	11,301	447	0
DeepSeek V3.2	10.0	10.0	100.0%	0		34.81s	8,307	507	859

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Claude Sonnet 4.6	3.0	10.0	0.0%	0		4.67s	204	431	0
DeepSeek V3.2	3.0	10.0	0.0%	0		83.99s	183	20	7,019

Быстрое сравнение

Сменить пару сравнения