AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs Xiaomi: MiMo-V2-Omni

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-08

Metrică	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal Lansare: 2026-05-08	MiMo-V2-Omni MiMo-V2-Omni none Lansare: 2026-03-18

Metrică	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal Lansare: 2026-05-08	MiMo-V2-Omni MiMo-V2-Omni none Lansare: 2026-03-18
Scor	6.8	6.3
Rang	#68	#79
Fiabilitate	10.0	10.0
Consistență	8.7	9.7
Teste corecte
Rată de trecere pe încercare	59.7%	43.9%
Teste instabile	3	1
Rulări totale	57	49
Cost per rezultat	0.111	0.241
Cost total	$0.012	$0.020
Preț de intrare	$0.250 / 1M	$0.400 / 1M
Preț de ieșire	$1.500 / 1M	$2.000 / 1M
Tokenuri de ieșire	2,457	2,254
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	1.41s	2.37s
Timp de răspuns (maxim)	4.49s	6.81s
Timp de răspuns (total)	26.72s	45.03s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	8.3	10.0	75.0%	0		1.10s	639	0
MiMo-V2-Omni	3.6	8.4	8.3%	1		1.63s	773	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.31s	636	0
MiMo-V2-Omni	6.6	10.0	0.0%	0		1.72s	399	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		2.53s	357	0
MiMo-V2-Omni	3.0	10.0	0.0%	0		5.96s	387	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.04s	279	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.76s	147	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	2.9	7.2	11.1%	1		1.02s	15	0
MiMo-V2-Omni	5.3	10.0	33.3%	0		2.10s	24	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	4.0	10.0	0.0%	0		791ms	63	0
MiMo-V2-Omni	4.1	10.0	0.0%	0		2.33s	103	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		932ms	72	0
MiMo-V2-Omni	6.5	10.0	50.0%	0		4.26s	30	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	6.0	4.6	66.7%	2		2.15s	153	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.16s	148	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		3.51s	234	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		5.40s	231	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		724ms	9	0
MiMo-V2-Omni	3.0	10.0	0.0%	0		1.30s	12	0

Comparație rapidă

Schimbă perechea de comparație

Gemini 3.1 Flash LiteminimalvsKimi K2.5medium Gemini 3.1 Flash LiteminimalvsGPT-5 Minimedium Mercury 2mediumvsMiMo-V2-Omninone Gemini 3.1 Flash LiteminimalvsQwen3.6 27Bmedium Gemini 3.1 Flash LiteminimalvsGrok 4.20medium DeepSeek V4 ProhighvsGemini 3.1 Flash Liteminimal GPT-5 NanomediumvsMiMo-V2-Omninone Gemini 3.1 Flash LiteminimalvsGPT-5.5none Grok 4.1 FastmediumvsMiMo-V2-Omninone Nemotron 3 SupermediumDisponibil gratuitvsMiMo-V2-Omninone Gemini 3.1 Flash LiteminimalvsQwen3.5 Plus 2026-02-15none Owl AlphamediumvsMiMo-V2-Omninone