Google: Gemini 3.1 Flash Lite Preview vs Xiaomi: MiMo-V2.5

Средний балл практически равен: 6.5 vs 6.5. MiMo-V2.5 (medium) имеет более низкую стоимость benchmark: $0.082 vs $0.646. Gemini 3.1 Flash Lite Preview (low) быстрее: 16.70s vs 32.20s, с долей успешных попыток 59.1% vs 69.7%.

Рекомендуемая модельMiMo-V2.5 (medium)Здесь у него лучший балл (6.5), при этом он примерно в 7.9 раза дешевле, чем Gemini 3.1 Flash Lite Preview (low).

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-21

Метрика	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Релиз: 2026-03-03	MiMo-V2.5 MiMo-V2.5 medium Релиз: 2026-04-22

Метрика	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Релиз: 2026-03-03	MiMo-V2.5 MiMo-V2.5 medium Релиз: 2026-04-22
Оценка	6.5	6.5
Ранг	#110	#107
Надежность	10.0	10.0
Стабильность	10.0	7.9
Тестов верно
Доля успешных попыток	59.1%	69.7%
Нестабильные тесты	0	6
Всего запусков	66	66
Стоимость за результат	4.969	3.124
Общая стоимость	$0.646	$0.082
Цена входа	$0.250 / 1M	$0.140 / 1M
Цена выхода	$1.500 / 1M	$0.280 / 1M
Общее число входных токенов	110,185	105,447
Выходные токены	14,717	7,120
Токены рассуждений	397,483	230,682
Время ответа (среднее)	16.70s	32.20s
Время ответа (макс.)	309.35s	162.44s
Время ответа (суммарно)	367.47s	708.46s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#110 Gemini 3.1 Flash Lite Preview

low

Стоимость: $0.002
Время: 3.7s
Токены: 1,203 tok

#107 MiMo-V2.5

medium

Стоимость: $0.002
Время: 54.8s
Токены: 5,247 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Категория:

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	8.3	10.0	75.0%	0		2.12s	506	462	1,638
MiMo-V2.5	10.0	10.0	100.0%	0		4.14s	621	281	1,739

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		1.39s	8,138	660	1,060
MiMo-V2.5	6.2	4.7	66.7%	2		97.14s	7,422	557	81,977

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		160.63s	85,851	12,656	389,079
MiMo-V2.5	8.7	6.9	83.3%	1		77.97s	78,669	4,656	39,393

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.00s	7,455	291	696
MiMo-V2.5	2.7	5.7	16.7%	1		6.33s	7,746	306	5,714

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		2.36s	641	18	1,212
MiMo-V2.5	5.3	10.0	33.3%	0		34.53s	735	507	49,478

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		1.54s	490	69	384
MiMo-V2.5	5.4	2.5	66.7%	1		5.37s	492	121	418

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.49s	621	72	753
MiMo-V2.5	9.9	10.0	100.0%	0		1.80s	672	88	801

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.69s	566	243	1,248
MiMo-V2.5	8.2	7.2	88.9%	1		20.25s	660	279	33,254

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		9.54s	5,757	237	993
MiMo-V2.5	10.0	10.0	100.0%	0		7.29s	8,220	303	2,424

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		1.35s	160	9	420
MiMo-V2.5	3.0	10.0	0.0%	0		51.29s	210	22	15,484

Быстрое сравнение

Сменить пару сравнения