AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Xiaomi: MiMo-V2-Pro

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-22

Metrică	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Lansare: 2026-03-03	MiMo-V2-Pro MiMo-V2-Pro medium Lansare: 2026-03-18

Metrică	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Lansare: 2026-03-03	MiMo-V2-Pro MiMo-V2-Pro medium Lansare: 2026-03-18
Scor	7.7	7.6
Rang	#34	#44
Fiabilitate	10.0	9.5
Consistență	10.0	7.9
Teste corecte
Rată de trecere pe încercare	65.0%	76.7%
Teste instabile	0	5
Rulări totale	60	60
Cost per rezultat	0.481	2.453
Cost total	$0.063	$0.295
Preț de intrare	$0.250 / 1M	$1.000 / 1M
Preț de ieșire	$1.500 / 1M	$3.000 / 1M
Tokenuri de ieșire	2,204	2,556
Tokenuri de raționament	33,657	81,879
Timp de răspuns (mediu)	3.68s	22.19s
Timp de răspuns (maxim)	14.93s	136.29s
Timp de răspuns (total)	73.60s	443.77s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	9.1	10.0	75.0%	0		2.33s	570	4,305
MiMo-V2-Pro	10.0	10.0	100.0%	0		2.86s	251	1,154

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	6.8	10.0	50.0%	0		3.98s	455	5,510
MiMo-V2-Pro	7.5	6.0	83.3%	1		94.21s	527	37,424

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		14.93s	327	7,347
MiMo-V2-Pro	4.7	1.6	66.7%	1		64.71s	380	14,186

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		2.29s	279	2,952
MiMo-V2-Pro	7.3	5.8	83.3%	1		17.20s	260	7,484

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		4.21s	18	5,325
MiMo-V2-Pro	5.3	10.0	33.3%	0		8.82s	170	2,158

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.16s	96	1,488
MiMo-V2-Pro	10.0	10.0	100.0%	0		4.92s	184	400

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.91s	72	2,121
MiMo-V2-Pro	9.9	10.0	100.0%	0		3.36s	83	667

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	7.7	10.0	66.7%	0		3.58s	141	1,896
MiMo-V2-Pro	6.4	4.4	77.8%	2		5.26s	410	1,700

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.80s	234	912
MiMo-V2-Pro	10.0	10.0	100.0%	0		8.19s	263	864

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		2.68s	12	1,801
MiMo-V2-Pro	3.0	10.0	0.0%	0		82.71s	28	15,842

Comparație rapidă

Schimbă perechea de comparație

GPT-5.2 ChatnonevsMiMo-V2-Promedium Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2-Promedium Gemini 3 Flash PreviewnonevsMiMo-V2-Promedium Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.2 Chatnone Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2-Promedium Gemini 3.1 Flash LitelowvsMiMo-V2-Promedium Gemini 3.1 Flash Lite PreviewmediumvsQwen3.7 Maxnone GPT-5.3 ChatnonevsMiMo-V2-Promedium DeepSeek V4 FlashhighDisponibil gratuitvsMiMo-V2-Promedium Qwen3.7 MaxnonevsMiMo-V2-Promedium Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.3 Chatnone DeepSeek V4 FlashhighDisponibil gratuitvsGemini 3.1 Flash Lite Previewmedium