AI BENCHY Compare

Qwen: Qwen3.5-27B vs Xiaomi: MiMo-V2-Omni

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-14

Metrică	Qwen3.5-27B Qwen3.5-27B medium Lansare: 2026-02-24	MiMo-V2-Omni MiMo-V2-Omni none Lansare: 2026-03-18

Metrică	Qwen3.5-27B Qwen3.5-27B medium Lansare: 2026-02-24	MiMo-V2-Omni MiMo-V2-Omni none Lansare: 2026-03-18
Scor	8.4	6.5
Rang	#8	#52
Consistență	8.8	10.0
Teste corecte
Rată de trecere pe încercare	81.5%	44.4%
Teste instabile	3	0
Rulări totale	54	20
Cost per rezultat	3.822	0.083
Cost total	$0.497	$0.007
Preț de intrare	$0.195 / 1M	$0.400 / 1M
Preț de ieșire	$1.560 / 1M	$2.000 / 1M
Tokenuri de ieșire	2,500	868
Tokenuri de raționament	242,500	0
Timp de răspuns (mediu)	53.03s	1.99s
Timp de răspuns (maxim)	163.96s	6.81s
Timp de răspuns (total)	954.46s	35.81s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-27B	8.7	7.9	91.7%	1		19.75s	569	31,505
MiMo-V2-Omni	4.8	10.0	25.0%	0		1.10s	74	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-27B	10.0	10.0	100.0%	0		70.35s	375	19,165
MiMo-V2-Omni	6.6	10.0	0.0%	0		1.72s	399	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-27B	10.0	10.0	100.0%	0		163.96s	483	9,991
MiMo-V2-Omni	3.0	10.0	0.0%	0		2.47s	110	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-27B	10.0	10.0	100.0%	0		30.26s	270	16,150
MiMo-V2-Omni	10.0	10.0	100.0%	0		1.69s	83	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-27B	5.3	10.0	33.3%	0		79.53s	43	52,368
MiMo-V2-Omni	5.3	10.0	33.3%	0		1.14s	8	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-27B	6.1	3.1	66.7%	1		101.41s	70	23,147
MiMo-V2-Omni	4.5	10.0	0.0%	0		1.19s	37	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-27B	10.0	10.0	100.0%	0		19.66s	97	11,638
MiMo-V2-Omni	6.5	10.0	50.0%	0		4.18s	22	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-27B	8.2	7.7	77.8%	1		64.61s	245	77,213
MiMo-V2-Omni	8.0	10.0	66.7%	0		2.71s	58	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-27B	10.0	10.0	100.0%	0		7.45s	348	1,323
MiMo-V2-Omni	10.0	10.0	100.0%	0		2.76s	77	0

Comparație rapidă

Schimbă perechea de comparație

Mercury 2mediumvsMiMo-V2-Omninone GPT-5 NanomediumvsMiMo-V2-Omninone Grok 4.1 FastmediumvsMiMo-V2-Omninone Nemotron 3 SupermediumDisponibil gratuitvsMiMo-V2-Omninone Gemini 3 Flash PreviewnonevsQwen3.5-27Bmedium Gemini 3.1 Flash Lite PreviewlowvsQwen3.5-27Bmedium Gemini 3 Flash PreviewlowvsQwen3.5-27Bmedium Grok 4.20mediumvsMiMo-V2-Omninone GPT-5.2 ChatnonevsQwen3.5-27Bmedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5-27Bmedium Kimi K2.5mediumvsMiMo-V2-Omninone GPT-5 MinimediumvsMiMo-V2-Omninone