AI BENCHY Compare

Qwen: Qwen3.5-27B vs Xiaomi: MiMo-V2-Omni

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-28

Metrică	Qwen3.5-27B Qwen3.5-27B none Lansare: 2026-02-24	MiMo-V2-Omni MiMo-V2-Omni none Lansare: 2026-03-18

Metrică	Qwen3.5-27B Qwen3.5-27B none Lansare: 2026-02-24	MiMo-V2-Omni MiMo-V2-Omni none Lansare: 2026-03-18
Scor	5.8	6.2
Rang	#108	#95
Fiabilitate	10.0	10.0
Consistență	9.3	9.7
Teste corecte
Rată de trecere pe încercare	40.0%	41.7%
Teste instabile	2	1
Rulări totale	60	52
Cost per rezultat	0.241	0.288
Cost total	$0.014	$0.023
Preț de intrare	$0.195 / 1M	$0.400 / 1M
Preț de ieșire	$1.560 / 1M	$2.000 / 1M
Tokenuri de ieșire	3,585	3,314
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	1.69s	2.44s
Timp de răspuns (maxim)	9.39s	6.81s
Timp de răspuns (total)	33.82s	48.81s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-27B	4.8	10.0	25.0%	0		788ms	267	0
MiMo-V2-Omni	3.6	8.4	8.3%	1		1.63s	773	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-27B	7.3	10.0	50.0%	0		1.98s	408	0
MiMo-V2-Omni	5.1	10.0	0.0%	0		2.75s	1,459	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-27B	2.8	1.6	33.3%	1		9.39s	1,461	0
MiMo-V2-Omni	3.0	10.0	0.0%	0		5.96s	387	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-27B	10.0	10.0	100.0%	0		1.43s	243	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.76s	147	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-27B	3.0	10.0	0.0%	0		540ms	15	0
MiMo-V2-Omni	5.3	10.0	33.3%	0		2.10s	24	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-27B	5.0	10.0	0.0%	0		2.51s	126	0
MiMo-V2-Omni	4.1	10.0	0.0%	0		2.33s	103	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-27B	6.3	10.0	50.0%	0		1.03s	69	0
MiMo-V2-Omni	6.5	10.0	50.0%	0		4.26s	30	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-27B	6.7	7.9	55.6%	1		1.38s	683	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.16s	148	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-27B	10.0	10.0	100.0%	0		3.54s	303	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		5.40s	231	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-27B	3.0	10.0	0.0%	0		599ms	10	0
MiMo-V2-Omni	3.0	10.0	0.0%	0		1.30s	12	0

Comparație rapidă

Schimbă perechea de comparație

CobuddymediumvsQwen3.5-27Bnone GPT-5 NanomediumvsMiMo-V2-Omninone Owl AlphamediumvsQwen3.5-27Bnone gpt-oss-120bmediumDisponibil gratuitvsQwen3.5-27Bnone Nemotron 3 SupermediumDisponibil gratuitvsQwen3.5-27Bnone Nemotron 3 SupermediumDisponibil gratuitvsMiMo-V2-Omninone gpt-oss-120bmediumDisponibil gratuitvsMiMo-V2-Omninone MiniMax M2.5mediumDisponibil gratuitvsQwen3.5-27Bnone Owl AlphamediumvsMiMo-V2-Omninone GPT-5 NanomediumvsQwen3.5-27Bnone Mercury 2mediumvsMiMo-V2-Omninone Mistral Small 4mediumvsQwen3.5-27Bnone