AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs Xiaomi: MiMo-V2.5-Pro

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-22

Метрика	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium Релиз: 2026-05-08	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Релиз: 2026-04-22

Метрика	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium Релиз: 2026-05-08	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Релиз: 2026-04-22
Оценка	7.7	7.6
Ранг	#35	#40
Надежность	10.0	10.0
Стабильность	9.2	8.9
Тестов верно
Доля успешных попыток	68.3%	68.3%
Нестабильные тесты	2	3
Всего запусков	60	60
Стоимость за результат	0.500	2.407
Общая стоимость	$0.065	$0.289
???? ?????	$0.250 / 1M	$1.000 / 1M
???? ??????	$1.500 / 1M	$3.000 / 1M
Выходные токены	2,248	4,957
Токены рассуждений	35,390	80,301
Время ответа (среднее)	3.18s	21.77s
Время ответа (макс.)	10.87s	130.77s
Время ответа (суммарно)	63.55s	435.33s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	9.1	10.0	75.0%	0		2.39s	604	4,201
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.26s	323	1,179

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	6.8	10.0	50.0%	0		3.59s	453	6,068
MiMo-V2.5-Pro	7.0	6.2	66.7%	1		81.67s	769	33,771

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		10.87s	327	7,401
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		53.36s	348	11,870

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.60s	279	2,845
MiMo-V2.5-Pro	7.3	5.8	83.3%	1		18.81s	260	8,383

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	2.9	7.2	11.1%	1		3.16s	15	5,165
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		37.87s	275	17,023

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		2.60s	84	1,142
MiMo-V2.5-Pro	5.5	10.0	0.0%	0		4.02s	155	163

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	9.9	10.0	100.0%	0		2.59s	75	3,320
MiMo-V2.5-Pro	9.9	10.0	100.0%	0		2.77s	82	803

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	7.6	7.2	77.8%	1		1.95s	165	2,450
MiMo-V2.5-Pro	6.7	7.9	55.6%	1		5.16s	493	2,187

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		4.55s	234	921
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		16.87s	311	2,908

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		3.08s	12	1,877
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		12.46s	1,941	2,014

Быстрое сравнение

Сменить пару сравнения

Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2.5-Promedium GPT-5.2 ChatnonevsMiMo-V2.5-Promedium Gemini 3 Flash PreviewnonevsMiMo-V2.5-Promedium Gemini 3.1 Flash LitemediumvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2.5-Promedium Gemini 3.1 Flash LitemediumvsQwen3.7 Maxnone Gemini 3.1 Flash LitelowvsMiMo-V2.5-Promedium GPT-5.3 ChatnonevsMiMo-V2.5-Promedium DeepSeek V4 FlashhighБесплатно доступноvsMiMo-V2.5-Promedium Qwen3.7 MaxnonevsMiMo-V2.5-Promedium Gemini 3.1 Flash LitemediumvsGPT-5.3 Chatnone Gemini 3.5 FlashminimalvsMiMo-V2.5-Promedium