AI BENCHY Compare

OpenAI: GPT-5 Nano vs Xiaomi: MiMo-V2.5

Rezumat

Comparație benchmark GPT-5 Nano vs MiMo-V2.5: GPT-5 Nano conduce la scorul mediu cu 6.3 vs 4.9. MiMo-V2.5 are costul de benchmark mai mic, $0.007 vs $0.081. MiMo-V2.5 este mai rapid cu 2.20s vs 42.51s, cu rate de reușită de 57.1% vs 27.0%.

Model recomandat: MiMo-V2.5 - Oferă cel mai bun compromis per total: scor competitiv (4.9), cost mai mic decât GPT-5 Nano și timp de răspuns echilibrat.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-04

Metrică	GPT-5 Nano GPT-5 Nano medium Lansare: 2025-08-07	MiMo-V2.5 MiMo-V2.5 none Lansare: 2026-04-22

Metrică	GPT-5 Nano GPT-5 Nano medium Lansare: 2025-08-07	MiMo-V2.5 MiMo-V2.5 none Lansare: 2026-04-22
Scor	6.3	4.9
Rang	#94	#143
Fiabilitate	10.0	10.0
Consistență	7.3	9.6
Teste corecte
Rată de trecere pe încercare	57.1%	27.0%
Teste instabile	7	1
Rulări totale	63	63
Cost per rezultat	0.897	0.413
Cost total	$0.081	$0.007
Preț de intrare	$0.050 / 1M	$0.140 / 1M
Preț de ieșire	$0.400 / 1M	$0.280 / 1M
Total tokenuri de intrare	34,108	41,985
Tokenuri de ieșire	5,464	2,267
Tokenuri de raționament	192,064	0
Timp de răspuns (mediu)	42.51s	2.20s
Timp de răspuns (maxim)	204.02s	6.86s
Timp de răspuns (total)	595.09s	46.21s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#94 GPT-5 Nano

medium

Cost: $0.006
Time: 108.5s
Tokens: 13,209 tok

#143 MiMo-V2.5

none

Cost: $0.007
Time: 267.4s
Tokens: 25,283 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5 Nano	6.5	7.9	58.3%	1		25.50s	606	1,221	21,184
MiMo-V2.5	3.5	8.0	16.7%	1		2.19s	645	282	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5 Nano	7.0	7.7	55.6%	1		41.62s	7,305	740	41,152
MiMo-V2.5	5.5	10.0	33.3%	0		3.24s	7,440	696	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5 Nano	10.0	10.0	100.0%	0		65.96s	11,019	578	17,984
MiMo-V2.5	3.0	10.0	0.0%	0		2.36s	15,075	330	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5 Nano	3.7	1.7	50.0%	2		21.42s	7,140	453	10,560
MiMo-V2.5	6.5	10.0	50.0%	0		1.01s	7,758	366	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5 Nano	5.2	4.4	55.6%	2		204.02s	619	237	64,448
MiMo-V2.5	3.0	10.0	0.0%	0		756ms	753	27	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5 Nano	4.1	10.0	0.0%	0		17.51s	477	202	4,608
MiMo-V2.5	4.4	9.9	0.0%	0		6.86s	498	81	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5 Nano	9.8	10.0	100.0%	0		15.64s	660	312	4,736
MiMo-V2.5	6.5	10.0	50.0%	0		751ms	684	72	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5 Nano	5.3	7.2	44.4%	1		20.63s	642	929	14,272
MiMo-V2.5	5.4	10.0	33.3%	0		2.13s	678	166	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5 Nano	10.0	10.0	100.0%	0		33.30s	5,445	558	6,976
MiMo-V2.5	10.0	10.0	100.0%	0		2.43s	8,238	231	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
GPT-5 Nano	3.0	10.0	0.0%	0		20.13s	195	234	6,144
MiMo-V2.5	3.0	10.0	0.0%	0		3.89s	216	16	0

Comparație rapidă

Schimbă perechea de comparație

GPT-5 NanomediumvsQwen3.5 Plus 2026-02-15none Ring-2.6-1TnonevsGPT-5 Nanomedium Gemini 2.5 FlashnonevsGPT-5 Nanomedium Gemini 3.1 Flash LitenonevsGPT-5 Nanomedium GPT-5 NanomediumvsQwen3.7 Plusnone Gemini 3.1 Flash LiteminimalvsGPT-5 Nanomedium GPT-5 NanomediumvsGLM 5none Qwen3 Coder NextmediumvsMiMo-V2.5none Gemma 4 31BnoneDisponibil gratuitvsGPT-5 Nanomedium Gemma 4 26B A4BnoneDisponibil gratuitvsGPT-5 Nanomedium DeepSeek V4 ProhighvsGPT-5 Nanomedium Nemotron 3 Ultra 550b A55bnoneDisponibil gratuitvsGPT-5 Nanomedium