AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Xiaomi: MiMo-V2-Omni

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-07

Metrică	Claude Opus 4.6 Claude Opus 4.6 medium Lansare: 2026-02-05	MiMo-V2-Omni MiMo-V2-Omni none Lansare: 2026-03-18

Metrică	Claude Opus 4.6 Claude Opus 4.6 medium Lansare: 2026-02-05	MiMo-V2-Omni MiMo-V2-Omni none Lansare: 2026-03-18
Scor	7.5	6.4
Rang	#35	#51
Consistență	9.0	10.0
Teste corecte
Rată de trecere pe încercare	68.6%	47.1%
Teste instabile	2	0
Rulări totale	51	17
Cost per rezultat	11.973	0.069
Cost total	$1.317	$0.006
Preț de intrare	$5.000 / 1M	$0.400 / 1M
Preț de ieșire	$25.000 / 1M	$2.000 / 1M
Tokenuri de ieșire	26,343	469
Tokenuri de raționament	17,434	0
Timp de răspuns (mediu)	20.87s	2.01s
Timp de răspuns (maxim)	83.40s	6.81s
Timp de răspuns (total)	208.73s	34.09s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Claude Opus 4.6	6.4	5.8	66.7%	2		7.45s	986	1,071
MiMo-V2-Omni	4.8	10.0	25.0%	0		1.10s	74	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Claude Opus 4.6	10.0	10.0	100.0%	0		76.66s	8,178	5,194
MiMo-V2-Omni	3.0	10.0	0.0%	0		2.47s	110	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Claude Opus 4.6	10.0	10.0	100.0%	0		7.37s	691	757
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.69s	83	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Claude Opus 4.6	3.0	10.0	0.0%	0		83.40s	14,642	8,687
MiMo-V2-Omni	5.3	10.0	33.3%	0		1.14s	8	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Claude Opus 4.6	10.0	10.0	100.0%	0		5.04s	188	292
MiMo-V2-Omni	4.5	10.0	0.0%	0		1.19s	37	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Claude Opus 4.6	10.0	10.0	100.0%	0		2.43s	266	467
MiMo-V2-Omni	6.5	10.0	50.0%	0		4.18s	22	0

Puzzle Solving	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Claude Opus 4.6	7.7	10.0	66.7%	0		4.60s	531	637
MiMo-V2-Omni	8.0	10.0	66.7%	0		2.71s	58	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Claude Opus 4.6	10.0	10.0	100.0%	0		9.73s	861	329
MiMo-V2-Omni	10.0	10.0	100.0%	0		2.76s	77	0

Comparație rapidă

Schimbă perechea de comparație

Claude Opus 4.6mediumvsGPT-5.3 Chatnone Mercury 2mediumvsMiMo-V2-Omninone GPT-5 NanomediumvsMiMo-V2-Omninone Grok 4.20 Multi Agent BetamediumvsMiMo-V2-Omninone Claude Opus 4.6mediumvsGPT-5.2 Chatnone Claude Opus 4.6mediumvsGemini 3.1 Flash Lite Previewnone GPT-5 MinimediumvsMiMo-V2-Omninone gpt-oss-120bmediumDisponibil gratuitvsMiMo-V2-Omninone Nemotron 3 SupermediumDisponibil gratuitvsMiMo-V2-Omninone Claude Opus 4.6mediumvsGemini 3 Flash Previewnone Claude Opus 4.6mediumvsGemini 3.1 Flash Lite Previewlow Grok 4.1 FastmediumvsMiMo-V2-Omninone