AI BENCHY Compare

inclusionAI: Ling-2.6-flash vs Xiaomi: MiMo-V2.5-Pro

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика	Ling-2.6-flash Ling-2.6-flash none Релиз: 2026-04-21	MiMo-V2.5-Pro MiMo-V2.5-Pro none Релиз: 2026-04-22

Метрика	Ling-2.6-flash Ling-2.6-flash none Релиз: 2026-04-21	MiMo-V2.5-Pro MiMo-V2.5-Pro none Релиз: 2026-04-22
Оценка	5.3	5.6
Ранг	#128	#115
Надежность	10.0	10.0
Стабильность	9.2	8.5
Тестов верно
Доля успешных попыток	35.1%	41.7%
Нестабильные тесты	2	4
Всего запусков	60	60
Стоимость за результат	0.005	0.637
Общая стоимость	$0.001	$0.039
???? ?????	$0.010 / 1M	$1.000 / 1M
???? ??????	$0.030 / 1M	$3.000 / 1M
Выходные токены	2,878	3,067
Токены рассуждений	0	0
Время ответа (среднее)	9.76s	1.84s
Время ответа (макс.)	35.34s	8.32s
Время ответа (суммарно)	185.37s	36.84s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ling-2.6-flash	6.8	8.1	58.3%	1		11.81s	573	0
MiMo-V2.5-Pro	3.3	8.1	8.3%	1		2.67s	994	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ling-2.6-flash	10.0	10.0	100.0%	0		11.21s	381	0
MiMo-V2.5-Pro	5.0	6.7	33.3%	1		1.80s	479	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ling-2.6-flash	3.0	10.0	0.0%	0		35.34s	1,069	0
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		3.54s	596	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ling-2.6-flash	6.5	10.0	50.0%	0		8.48s	246	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		1.32s	249	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ling-2.6-flash	3.0	10.0	0.0%	0		4.95s	24	0
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		877ms	27	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ling-2.6-flash	4.0	10.0	0.0%	0		1.45s	109	0
MiMo-V2.5-Pro	4.0	10.0	0.0%	0		2.58s	87	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ling-2.6-flash	9.8	10.0	100.0%	0		5.52s	81	0
MiMo-V2.5-Pro	6.4	10.0	50.0%	0		1.03s	66	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ling-2.6-flash	2.9	7.2	11.1%	1		9.14s	151	0
MiMo-V2.5-Pro	6.7	4.7	77.8%	2		1.32s	297	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ling-2.6-flash	3.0	10.0	0.0%	0		18.80s	229	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.30s	258	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Ling-2.6-flash	3.0	10.0	0.0%	0		1.06s	15	0
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		1.89s	14	0

Быстрое сравнение

Сменить пару сравнения

gpt-oss-120bmediumБесплатно доступноvsMiMo-V2.5-Pronone Ling-2.6-flashnonevsElephant Alphamedium Ling-2.6-flashnonevsMistral Small 4medium MiniMax M2.5mediumБесплатно доступноvsMiMo-V2.5-Pronone Ling-2.6-flashnonevsMiniMax M2.5mediumБесплатно доступно Mistral Small 4mediumvsMiMo-V2.5-Pronone CobuddymediumБесплатно доступноvsMiMo-V2.5-Pronone Elephant AlphamediumvsMiMo-V2.5-Pronone Ling-2.6-flashnonevsMiniMax M2.7medium Owl AlphamediumvsMiMo-V2.5-Pronone Ling-2.6-flashnonevsgpt-oss-120bmediumБесплатно доступно Nemotron 3 SupermediumБесплатно доступноvsMiMo-V2.5-Pronone