AI BENCHY Compare

OpenAI: GPT-5.3-Codex vs Xiaomi: MiMo-V2-Omni

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-14

Metrică	GPT-5.3-Codex GPT-5.3-Codex medium Lansare: 2026-02-05	MiMo-V2-Omni MiMo-V2-Omni none Lansare: 2026-03-18

Metrică	GPT-5.3-Codex GPT-5.3-Codex medium Lansare: 2026-02-05	MiMo-V2-Omni MiMo-V2-Omni none Lansare: 2026-03-18
Scor	8.6	6.5
Rang	#5	#52
Consistență	8.7	10.0
Teste corecte
Rată de trecere pe încercare	83.3%	44.4%
Teste instabile	3	0
Rulări totale	54	20
Cost per rezultat	4.405	0.083
Cost total	$0.573	$0.007
Preț de intrare	$1.750 / 1M	$0.400 / 1M
Preț de ieșire	$14.000 / 1M	$2.000 / 1M
Tokenuri de ieșire	2,279	868
Tokenuri de raționament	35,179	0
Timp de răspuns (mediu)	15.38s	1.99s
Timp de răspuns (maxim)	100.93s	6.81s
Timp de răspuns (total)	276.91s	35.81s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.3-Codex	8.7	7.9	91.7%	1		4.16s	240	1,722
MiMo-V2-Omni	4.8	10.0	25.0%	0		1.10s	74	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.3-Codex	10.0	10.0	100.0%	0		8.95s	491	1,530
MiMo-V2-Omni	6.6	10.0	0.0%	0		1.72s	399	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.3-Codex	10.0	10.0	100.0%	0		19.56s	364	2,731
MiMo-V2-Omni	3.0	10.0	0.0%	0		2.47s	110	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.07s	234	728
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.69s	83	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.3-Codex	5.9	7.2	55.6%	1		64.31s	64	25,308
MiMo-V2-Omni	5.3	10.0	33.3%	0		1.14s	8	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.3-Codex	4.6	10.0	0.0%	0		4.87s	187	331
MiMo-V2-Omni	4.5	10.0	0.0%	0		1.19s	37	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.3-Codex	10.0	10.0	100.0%	0		3.04s	93	693
MiMo-V2-Omni	6.5	10.0	50.0%	0		4.18s	22	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.3-Codex	9.0	7.9	88.9%	1		5.12s	352	1,644
MiMo-V2-Omni	8.0	10.0	66.7%	0		2.71s	58	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
GPT-5.3-Codex	10.0	10.0	100.0%	0		6.37s	254	492
MiMo-V2-Omni	10.0	10.0	100.0%	0		2.76s	77	0

Comparație rapidă

Schimbă perechea de comparație

Mercury 2mediumvsMiMo-V2-Omninone GPT-5 NanomediumvsMiMo-V2-Omninone Grok 4.1 FastmediumvsMiMo-V2-Omninone Gemini 3 Flash PreviewlowvsGPT-5.3-Codexmedium Nemotron 3 SupermediumDisponibil gratuitvsMiMo-V2-Omninone Gemini 3 Flash PreviewnonevsGPT-5.3-Codexmedium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.3-Codexmedium Grok 4.20mediumvsMiMo-V2-Omninone Kimi K2.5mediumvsMiMo-V2-Omninone GPT-5 MinimediumvsMiMo-V2-Omninone gpt-oss-120bmediumDisponibil gratuitvsMiMo-V2-Omninone Gemini 3.1 Flash Lite PreviewnonevsGPT-5.3-Codexmedium