AI BENCHY Compare

Qwen: Qwen3.6 Max Preview vs Xiaomi: MiMo-V2-Pro

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-01

Metrică	Qwen3.6 Max Preview Qwen3.6 Max Preview none Lansare: 2026-04-20	MiMo-V2-Pro MiMo-V2-Pro medium Lansare: 2026-03-18

Metrică	Qwen3.6 Max Preview Qwen3.6 Max Preview none Lansare: 2026-04-20	MiMo-V2-Pro MiMo-V2-Pro medium Lansare: 2026-03-18
Scor	7.5	8.1
Rang	#52	#33
Fiabilitate	10.0	N/D
Consistență	9.1	8.6
Teste corecte
Rată de trecere pe încercare	68.5%	77.8%
Teste instabile	2	3
Rulări totale	54	48
Cost per rezultat	0.752	1.320
Cost total	$0.083	$0.159
Preț de intrare	$1.040 / 1M	$1.000 / 1M
Preț de ieșire	$6.240 / 1M	$3.000 / 1M
Tokenuri de ieșire	4,732	2,360
Tokenuri de raționament	0	38,320
Timp de răspuns (mediu)	3.38s	12.27s
Timp de răspuns (maxim)	20.51s	64.71s
Timp de răspuns (total)	60.83s	208.56s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 Max Preview	5.2	7.9	41.7%	1		2.63s	513	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		3.06s	223	1,107

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 Max Preview	5.0	2.0	66.7%	1		3.45s	426	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		52.12s	485	11,361

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 Max Preview	3.0	10.0	0.0%	0		20.51s	2,842	0
MiMo-V2-Pro	4.7	1.6	66.7%	1		64.71s	380	14,186

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		2.87s	243	0
MiMo-V2-Pro	7.3	5.8	83.3%	1		17.20s	260	7,484

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 Max Preview	7.7	10.0	66.7%	0		1.22s	18	0
MiMo-V2-Pro	5.3	10.0	33.3%	0		6.00s	155	1,048

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 Max Preview	4.3	10.0	0.0%	0		1.62s	76	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		4.06s	198	424

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 Max Preview	9.8	10.0	100.0%	0		1.45s	69	0
MiMo-V2-Pro	9.9	10.0	100.0%	0		3.36s	83	667

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		2.38s	323	0
MiMo-V2-Pro	7.0	7.2	55.6%	1		4.71s	313	1,179

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		5.27s	222	0
MiMo-V2-Pro	10.0	10.0	100.0%	0		8.19s	263	864

Comparație rapidă

Schimbă perechea de comparație

Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2-Promedium Seed-2.0-MinimediumvsQwen3.6 Max Previewnone GPT-5.4 NanomediumvsQwen3.6 Max Previewnone Gemini 3 Flash PreviewnonevsMiMo-V2-Promedium HY3 PreviewlowDisponibil gratuitvsMiMo-V2-Promedium GPT-5.2mediumvsQwen3.6 Max Previewnone Qwen3.6 Max PreviewnonevsMiMo-V2-Flashmedium Claude Opus 4.6mediumvsQwen3.6 Max Previewnone Qwen3.6 Max PreviewnonevsMiMo-V2-Omnimedium GPT-5.2 ChatnonevsMiMo-V2-Promedium Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2-Promedium Kimi K2.6mediumvsQwen3.6 Max Previewnone