AI BENCHY Compare

Owl Alpha vs Xiaomi: MiMo-V2-Omni

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-08

Metrică	Owl Alpha Owl Alpha medium Lansare: 2026-04-30	MiMo-V2-Omni MiMo-V2-Omni none Lansare: 2026-03-18

Metrică	Owl Alpha Owl Alpha medium Lansare: 2026-04-30	MiMo-V2-Omni MiMo-V2-Omni none Lansare: 2026-03-18
Scor	6.0	6.3
Rang	#88	#79
Fiabilitate	10.0	10.0
Consistență	9.6	9.7
Teste corecte
Rată de trecere pe încercare	43.9%	43.9%
Teste instabile	1	1
Rulări totale	57	49
Cost per rezultat	0.000	0.241
Cost total	$0.000	$0.020
Preț de intrare	$0.000 / 1M	$0.400 / 1M
Preț de ieșire	$0.000 / 1M	$2.000 / 1M
Tokenuri de ieșire	1,613	2,254
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	10.58s	2.37s
Timp de răspuns (maxim)	58.63s	6.81s
Timp de răspuns (total)	201.03s	45.03s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Owl Alpha	4.8	10.0	25.0%	0		3.97s	87	0
MiMo-V2-Omni	3.6	8.4	8.3%	1		1.63s	773	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Owl Alpha	10.0	10.0	100.0%	0		7.35s	402	0
MiMo-V2-Omni	6.6	10.0	0.0%	0		1.72s	399	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Owl Alpha	3.0	10.0	0.0%	0		10.01s	315	0
MiMo-V2-Omni	3.0	10.0	0.0%	0		5.96s	387	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Owl Alpha	10.0	10.0	100.0%	0		21.64s	246	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.76s	147	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Owl Alpha	5.3	10.0	33.3%	0		8.58s	28	0
MiMo-V2-Omni	5.3	10.0	33.3%	0		2.10s	24	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Owl Alpha	4.3	10.0	0.0%	0		58.63s	98	0
MiMo-V2-Omni	4.1	10.0	0.0%	0		2.33s	103	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Owl Alpha	6.3	10.0	50.0%	0		9.59s	57	0
MiMo-V2-Omni	6.5	10.0	50.0%	0		4.26s	30	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Owl Alpha	5.3	7.2	44.4%	1		3.44s	135	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.16s	148	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Owl Alpha	10.0	10.0	100.0%	0		8.26s	228	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		5.40s	231	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Owl Alpha	3.0	10.0	0.0%	0		2.38s	17	0
MiMo-V2-Omni	3.0	10.0	0.0%	0		1.30s	12	0

Comparație rapidă

Schimbă perechea de comparație

Owl AlphamediumvsQwen3.5-Flashnone Owl AlphamediumvsGLM 5V Turbonone Seed-2.0-LitenonevsOwl Alphamedium Mercury 2mediumvsMiMo-V2-Omninone Owl AlphamediumvsQwen3.5 Plus 2026-04-20none Owl AlphamediumvsQwen3.5-35B-A3Bnone GPT-5 NanomediumvsMiMo-V2-Omninone Owl AlphamediumvsMiMo-V2-Pronone Grok 4.1 FastmediumvsMiMo-V2-Omninone Owl AlphamediumvsQwen3.5-27Bnone Owl AlphamediumvsQwen3.6 27Bnone DeepSeek V4 PrononevsOwl Alphamedium