Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs DeepSeek: DeepSeek V3.2

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-30

Метрика Claude Sonnet 4.6 Claude Sonnet 4.6 medium Релиз: 2026-02-17 DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01
Оценка 8.0 8.0
Ранг #36 #37
Надежность Н/Д Н/Д
Стабильность 9.5 8.2
Тестов верно
Доля успешных попыток 74.1% 79.6%
Нестабильные тесты 1 4
Всего запусков 54 52
Стоимость за результат 8.930 0.231
Общая стоимость $1.161 $0.028
???? ????? $3.000 / 1M $0.252 / 1M
???? ?????? $15.000 / 1M $0.378 / 1M
Выходные токены 42,068 7,554
Токены рассуждений 26,784 45,588
Время ответа (среднее) 12.66s 43.49s
Время ответа (макс.) 46.35s 180.92s
Время ответа (суммарно) 126.62s 782.73s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 6.5 10.0 50.0% 0 2.98s 1,046 1,093
DeepSeek V3.2 8.4 9.9 75.0% 0 30.72s 3,773 7,523
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 35.76s 6,894 2,097
DeepSeek V3.2 4.7 1.6 66.7% 1 180.92s 626 6,792
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 46.35s 5,871 3,962
DeepSeek V3.2 10.0 10.0 100.0% 0 93.11s 571 6,296
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 13.90s 649 742
DeepSeek V3.2 10.0 10.0 100.0% 0 36.09s 207 7,693
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 2.9 7.2 11.1% 1 0ms 25,790 16,919
DeepSeek V3.2 5.3 7.2 44.4% 1 21.78s 15 4,933
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.94s 256 433
DeepSeek V3.2 5.4 2.5 66.7% 1 31.30s 68 2,366
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 2.61s 318 552
DeepSeek V3.2 10.0 10.0 100.0% 0 35.78s 1,397 2,845
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.80s 589 635
DeepSeek V3.2 8.2 7.2 88.9% 1 36.87s 390 6,281
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Claude Sonnet 4.6 10.0 10.0 100.0% 0 7.48s 655 351
DeepSeek V3.2 10.0 10.0 100.0% 0 34.81s 507 859

Быстрое сравнение

Сменить пару сравнения