AI BENCHY
Сравнить Графики
❤️ Made by XCS
Your ad here

#12

DeepSeek V3.2

Deepseek · Релиз: 2025-12-01 · deepseek/deepseek-v3.2::medium

Средний балл

6.99

Стоимость за результат

0.193

Стабильность

8.75

Общая стоимость

$0.018

Тестов верно

9

Тест считается полностью пройденным, только если все его прогоны успешны.

Ошибочных тестов

5

Доля успешных попыток: 71.4%

Нестабильные тесты

2

Время ответа: среднее 36.24s · суммарно 507.30s · макс. 79.03s

Неверный ответ: 3 Не соблюдены инструкции: 1 Тайм-аут: 1

Лучшие модели по оценке

Выберите первую модель, затем нажмите вторую, чтобы открыть страницу сравнения бок о бок.

Быстрое сравнение

Разбивка по категориям

Категория Средний балл Стабильность Тестов верно
Anti-AI Tricks 7.00 9.86 2/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 4.00 7.21 1/3
Instructions following 7.00 9.84 1/2
Puzzle Solving 7.00 7.21 2/3
Tool Calling 10.00 10.00 1/1