Навигация
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Ring 2.6 1t

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-10

Метрика DeepSeek V3.2 DeepSeek V3.2 medium Релиз: 2025-12-01 Ring 2.6 1t Ring 2.6 1t none Релиз: 2026-05-10 Бесплатно доступно
Оценка 7.2 7.2
Ранг #61 #57
Надежность 10.0 9.8
Стабильность 7.5 9.1
Тестов верно
Доля успешных попыток 72.8% 62.5%
Нестабильные тесты 6 2
Всего запусков 57 57
Стоимость за результат 0.278 0.000
Общая стоимость $0.031 $0.000
???? ????? $0.252 / 1M $0.000 / 1M
???? ?????? $0.378 / 1M $0.000 / 1M
Выходные токены 7,035 39,954
Токены рассуждений 53,765 0
Время ответа (среднее) 46.06s 55.10s
Время ответа (макс.) 180.92s 143.82s
Время ответа (суммарно) 875.23s 881.55s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 9.2 10.0 100.0% 0 24.23s 3,247 6,953
Ring 2.6 1t 9.2 8.4 91.7% 1 43.33s 5,575 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 4.7 1.6 66.7% 1 180.92s 626 6,792
Ring 2.6 1t 10.0 10.0 100.0% 0 143.82s 5,036 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 10.0 10.0 100.0% 0 93.11s 571 6,296
Ring 2.6 1t 0.0 0.0 0.0% 0 0ms 0 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 10.0 10.0 100.0% 0 36.09s 207 7,693
Ring 2.6 1t 3.0 10.0 0.0% 0 45.87s 1,529 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 2.9 4.4 22.2% 2 24.27s 21 6,838
Ring 2.6 1t 5.3 7.2 44.4% 1 73.40s 17,728 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 3.8 2.5 50.0% 1 58.29s 49 2,189
Ring 2.6 1t 4.3 10.0 0.0% 0 15.63s 846 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 10.0 10.0 100.0% 0 35.78s 1,397 2,845
Ring 2.6 1t 9.8 10.0 100.0% 0 27.36s 2,004 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 6.7 5.0 66.7% 2 36.87s 390 6,281
Ring 2.6 1t 7.7 10.0 66.7% 0 31.47s 3,469 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 10.0 10.0 100.0% 0 34.81s 507 859
Ring 2.6 1t 0.0 0.0 0.0% 0 0ms 0 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
DeepSeek V3.2 3.0 10.0 0.0% 0 83.99s 20 7,019
Ring 2.6 1t 3.0 10.0 0.0% 0 133.60s 3,767 0

Быстрое сравнение

Сменить пару сравнения