AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs Xiaomi: MiMo-V2.5

Сводка

Сравнение benchmark Gemini 3.1 Flash Lite vs MiMo-V2.5: MiMo-V2.5 лидирует по среднему баллу: 6.7 vs 6.4. Gemini 3.1 Flash Lite имеет более низкую стоимость benchmark: $0.028 vs $0.061. Gemini 3.1 Flash Lite быстрее: 1.89s vs 27.11s, с долей успешных попыток 61.9% vs 69.8%.

Рекомендуемая модель: Gemini 3.1 Flash Lite - Его балл близок к лучшему здесь (6.4 против 6.7), при этом он примерно в 2.2 раза дешевле, чем MiMo-V2.5.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-02

Метрика	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite low Релиз: 2026-05-08	MiMo-V2.5 MiMo-V2.5 medium Релиз: 2026-04-22

Метрика	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite low Релиз: 2026-05-08	MiMo-V2.5 MiMo-V2.5 medium Релиз: 2026-04-22
Оценка	6.4	6.7
Ранг	#88	#79
Надежность	10.0	10.0
Стабильность	9.3	8.1
Тестов верно
Доля успешных попыток	61.9%	69.8%
Нестабильные тесты	2	5
Всего запусков	63	63
Стоимость за результат	0.227	2.966
Общая стоимость	$0.028	$0.061
Цена входа	$0.250 / 1M	$0.105 / 1M
Цена выхода	$1.500 / 1M	$0.280 / 1M
Общее число входных токенов	36,892	41,838
Выходные токены	2,732	2,827
Токены рассуждений	9,260	198,898
Время ответа (среднее)	1.89s	27.11s
Время ответа (макс.)	5.66s	162.44s
Время ответа (суммарно)	39.62s	569.38s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#88 Gemini 3.1 Flash Lite

low

Стоимость: $0.003
Время: 4.0s
Токены: 1,479 tok

#79 MiMo-V2.5

medium

Стоимость: $0.002
Время: 54.8s
Токены: 5,247 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	7.3	6.2	75.0%	2		1.84s	500	1,013	1,548
MiMo-V2.5	10.0	10.0	100.0%	0		4.14s	621	281	1,739

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	5.5	10.0	33.3%	0		1.53s	8,132	471	1,072
MiMo-V2.5	6.2	4.7	66.7%	2		97.14s	7,422	557	81,977

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		4.48s	12,870	348	975
MiMo-V2.5	10.0	10.0	100.0%	0		16.86s	15,060	363	7,609

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.44s	7,453	291	697
MiMo-V2.5	2.7	5.7	16.7%	1		6.33s	7,746	306	5,714

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	5.3	10.0	33.3%	0		1.52s	639	15	1,214
MiMo-V2.5	5.3	10.0	33.3%	0		34.53s	735	507	49,478

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	4.0	10.0	0.0%	0		1.37s	492	69	438
MiMo-V2.5	5.4	2.5	66.7%	1		5.37s	492	121	418

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.52s	619	72	760
MiMo-V2.5	9.9	10.0	100.0%	0		1.80s	672	88	801

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.40s	570	210	1,191
MiMo-V2.5	8.2	7.2	88.9%	1		20.25s	660	279	33,254

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		5.66s	5,457	234	945
MiMo-V2.5	10.0	10.0	100.0%	0		7.29s	8,220	303	2,424

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		1.46s	160	9	420
MiMo-V2.5	3.0	10.0	0.0%	0		51.29s	210	22	15,484

Быстрое сравнение

Сменить пару сравнения