AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs Ling 2.6 Flash

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-24

Метрика	DeepSeek V4 Flash DeepSeek V4 Flash none Релиз: 2026-04-24	Ling 2.6 Flash Ling 2.6 Flash none Релиз: 2026-04-21 Бесплатно доступно

Метрика	DeepSeek V4 Flash DeepSeek V4 Flash none Релиз: 2026-04-24	Ling 2.6 Flash Ling 2.6 Flash none Релиз: 2026-04-21 Бесплатно доступно
Оценка	5.3	5.4
Ранг	#89	#87
Стабильность	9.1	9.5
Тестов верно
Доля успешных попыток	33.3%	35.2%
Нестабильные тесты	2	1
Всего запусков	54	52
Стоимость за результат	0.147	0.000
Общая стоимость	$0.008	$0.000
???? ?????	$0.140 / 1M	$0.000 / 1M
???? ??????	$0.280 / 1M	$0.000 / 1M
Выходные токены	4,444	3,338
Токены рассуждений	0	0
Время ответа (среднее)	29.39s	11.33s
Время ответа (макс.)	111.96s	35.34s
Время ответа (суммарно)	529.10s	203.88s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	3.0	10.0	0.0%	0		20.18s	174	0
Ling 2.6 Flash	6.5	10.0	50.0%	0		12.30s	1,064	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	6.3	10.0	0.0%	0		24.04s	471	0
Ling 2.6 Flash	10.0	10.0	100.0%	0		11.21s	381	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	4.5	2.1	66.7%	1		111.96s	2,664	0
Ling 2.6 Flash	3.0	10.0	0.0%	0		35.34s	1,069	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	10.0	10.0	100.0%	0		23.79s	195	0
Ling 2.6 Flash	6.5	10.0	50.0%	0		8.48s	246	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	5.3	10.0	33.3%	0		19.73s	18	0
Ling 2.6 Flash	3.0	10.0	0.0%	0		4.94s	20	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	4.2	9.9	0.0%	0		23.74s	67	0
Ling 2.6 Flash	4.1	10.0	0.0%	0		11.85s	106	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	6.5	10.0	50.0%	0		17.54s	321	0
Ling 2.6 Flash	9.8	10.0	100.0%	0		5.52s	81	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	3.1	7.3	11.1%	1		22.96s	207	0
Ling 2.6 Flash	2.9	7.2	11.1%	1		11.55s	142	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
DeepSeek V4 Flash	10.0	10.0	100.0%	0		77.93s	327	0
Ling 2.6 Flash	3.0	10.0	0.0%	0		18.80s	229	0

Быстрое сравнение

Сменить пару сравнения

DeepSeek V4 FlashnonevsMiniMax M2.7medium DeepSeek V4 FlashnonevsElephant Alphamedium Ling 2.6 FlashnoneБесплатно доступноvsMiniMax M2.7medium Ling 2.6 FlashnoneБесплатно доступноvsElephant Alphamedium Ling 2.6 FlashnoneБесплатно доступноvsMistral Small 4medium Ling 2.6 FlashnoneБесплатно доступноvsMiniMax M2.5mediumБесплатно доступно DeepSeek V4 FlashnonevsMistral Small 4medium DeepSeek V4 FlashnonevsMiniMax M2.5mediumБесплатно доступно Ling 2.6 FlashnoneБесплатно доступноvsgpt-oss-120bmediumБесплатно доступно DeepSeek V4 Flashnonevsgpt-oss-120bmediumБесплатно доступно DeepSeek V4 FlashnonevsQwen3 Coder Nextmedium Ling 2.6 FlashnoneБесплатно доступноvsQwen3 Coder Nextmedium