AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs inclusionAI: Ring-2.6-1T

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	Ring-2.6-1T Ring-2.6-1T medium Релиз: 2026-05-10

Метрика	DeepSeek V3.2 DeepSeek V3.2 none Релиз: 2025-12-01	Ring-2.6-1T Ring-2.6-1T medium Релиз: 2026-05-10
Оценка	5.6	7.2
Ранг	#114	#61
Надежность	10.0	9.9
Стабильность	8.0	8.7
Тестов верно
Доля успешных попыток	46.7%	66.7%
Нестабильные тесты	5	3
Всего запусков	60	60
Стоимость за результат	0.254	0.000
Общая стоимость	$0.018	$0.000
???? ?????	$0.252 / 1M	$0.075 / 1M
???? ??????	$0.378 / 1M	$0.625 / 1M
Выходные токены	11,163	21,752
Токены рассуждений	0	42,754
Время ответа (среднее)	14.46s	61.29s
Время ответа (макс.)	115.89s	304.19s
Время ответа (суммарно)	289.21s	1164.50s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.3	8.2	12.5%	1		9.35s	1,073	0
Ring-2.6-1T	10.0	10.0	100.0%	0		42.21s	3,833	4,891

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.1	5.4	16.7%	1		20.87s	4,522	0
Ring-2.6-1T	10.0	10.0	100.0%	0		59.65s	1,369	3,985

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	2,887	0
Ring-2.6-1T	10.0	10.0	100.0%	0		304.19s	324	6,088

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	1,710	0
Ring-2.6-1T	6.5	10.0	50.0%	0		37.36s	840	1,937

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	6.9	16.7%	1		4.17s	21	0
Ring-2.6-1T	3.5	4.4	33.3%	2		64.92s	9,744	15,013

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.6	10.0	100.0%	0		9.32s	43	0
Ring-2.6-1T	4.1	10.0	0.0%	0		58.26s	150	583

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	66	0
Ring-2.6-1T	9.8	10.0	100.0%	0		11.78s	266	1,831

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	7.5	7.7	88.9%	1		7.13s	302	0
Ring-2.6-1T	5.9	7.2	55.6%	1		20.73s	697	2,479

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	522	0
Ring-2.6-1T	10.0	10.0	100.0%	0		104.44s	234	1,531

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	17	0
Ring-2.6-1T	3.0	10.0	0.0%	0		113.91s	4,295	4,416

Быстрое сравнение

Сменить пару сравнения

DeepSeek V3.2nonevsgpt-oss-120bmediumБесплатно доступно DeepSeek V3.2nonevsMiniMax M2.5mediumБесплатно доступно Ring-2.6-1TmediumvsQwen3.6 Max Previewnone DeepSeek V4 FlashhighБесплатно доступноvsRing-2.6-1Tmedium Ring-2.6-1TmediumvsGPT-5.3 Chatnone DeepSeek V3.2nonevsMistral Small 4medium CobuddymediumБесплатно доступноvsDeepSeek V3.2none Gemini 3.1 Flash LitelowvsRing-2.6-1Tmedium DeepSeek V3.2nonevsElephant Alphamedium Claude Sonnet 4.6nonevsRing-2.6-1Tmedium Gemini 3.1 Flash Lite PreviewnonevsRing-2.6-1Tmedium DeepSeek V3.2nonevsOwl Alphamedium