AI BENCHY Compare

Xiaomi: MiMo-V2.5 vs Z.ai: GLM 5.1

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-22

Metrică	MiMo-V2.5 MiMo-V2.5 medium Lansare: 2026-04-22	GLM 5.1 GLM 5.1 medium Lansare: 2026-04-07

Metrică	MiMo-V2.5 MiMo-V2.5 medium Lansare: 2026-04-22	GLM 5.1 GLM 5.1 medium Lansare: 2026-04-07
Scor	7.8	7.8
Rang	#35	#34
Consistență	8.6	8.6
Teste corecte
Rată de trecere pe încercare	74.1%	75.9%
Teste instabile	3	3
Rulări totale	54	54
Cost per rezultat	2.102	1.674
Cost total	$0.253	$0.201
Preț de intrare	$0.400 / 1M	$1.050 / 1M
Preț de ieșire	$2.000 / 1M	$3.500 / 1M
Tokenuri de ieșire	2,840	8,005
Tokenuri de raționament	116,242	49,090
Timp de răspuns (mediu)	13.71s	24.13s
Timp de răspuns (maxim)	86.93s	118.52s
Timp de răspuns (total)	246.73s	410.25s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiMo-V2.5	10.0	10.0	100.0%	0		1.98s	303	2,022
GLM 5.1	10.0	10.0	100.0%	0		8.31s	401	5,122

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiMo-V2.5	10.0	10.0	100.0%	0		31.48s	488	14,813
GLM 5.1	4.7	1.6	66.7%	1		118.52s	1,339	13,777

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiMo-V2.5	10.0	10.0	100.0%	0		16.86s	363	7,609
GLM 5.1	9.5	10.0	100.0%	0		43.11s	327	4,206

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiMo-V2.5	2.7	5.7	16.7%	1		6.33s	306	5,714
GLM 5.1	10.0	10.0	100.0%	0		9.33s	991	4,552

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiMo-V2.5	5.3	10.0	33.3%	0		34.53s	507	49,478
GLM 5.1	5.3	10.0	33.3%	0		29.77s	969	11,314

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiMo-V2.5	3.8	2.5	33.3%	1		1.55s	118	170
GLM 5.1	10.0	10.0	100.0%	0		20.95s	2,875	2,875

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiMo-V2.5	9.9	10.0	100.0%	0		1.80s	88	801
GLM 5.1	6.4	5.8	66.7%	1		7.47s	204	1,617

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiMo-V2.5	8.2	7.2	88.9%	1		20.60s	364	33,211
GLM 5.1	8.2	7.2	88.9%	1		23.85s	899	5,627

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
MiMo-V2.5	10.0	10.0	100.0%	0		7.29s	303	2,424
GLM 5.1	3.0	10.0	0.0%	0		0ms	0	0

Comparație rapidă

Schimbă perechea de comparație

GPT-5.3 ChatnonevsMiMo-V2.5medium Gemini 3.1 Flash Lite PreviewnonevsGLM 5.1medium GPT-5.2 ChatnonevsGLM 5.1medium GPT-5.3 ChatnonevsGLM 5.1medium Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2.5medium GPT-5.2 ChatnonevsMiMo-V2.5medium Gemini 3.1 Flash Lite PreviewlowvsGLM 5.1medium Gemini 3 Flash PreviewnonevsGLM 5.1medium Claude Sonnet 4.6nonevsMiMo-V2.5medium Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2.5medium Gemini 3 Flash PreviewnonevsMiMo-V2.5medium Claude Sonnet 4.6nonevsGLM 5.1medium