AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-02-15 vs Xiaomi: MiMo-V2-Flash

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-29

Metrică	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none Lansare: 2026-02-15	MiMo-V2-Flash MiMo-V2-Flash medium Lansare: 2025-12-16

Metrică	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none Lansare: 2026-02-15	MiMo-V2-Flash MiMo-V2-Flash medium Lansare: 2025-12-16
Scor	6.4	7.1
Rang	#94	#77
Fiabilitate	10.0	10.0
Consistență	9.3	8.7
Teste corecte
Rată de trecere pe încercare	48.3%	63.3%
Teste instabile	2	3
Rulări totale	60	60
Cost per rezultat	0.195	0.345
Cost total	$0.018	$0.038
Preț de intrare	$0.260 / 1M	$0.100 / 1M
Preț de ieșire	$1.560 / 1M	$0.300 / 1M
Tokenuri de ieșire	2,474	12,458
Tokenuri de raționament	0	115,182
Timp de răspuns (mediu)	2.40s	20.28s
Timp de răspuns (maxim)	6.65s	96.01s
Timp de răspuns (total)	33.56s	283.87s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	4.8	10.0	25.0%	0		1.91s	517	0
MiMo-V2-Flash	8.1	7.9	83.3%	1		15.85s	1,674	23,559

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	4.9	6.9	16.7%	1		2.54s	467	0
MiMo-V2-Flash	4.1	5.8	33.3%	1		7.20s	456	3,648

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		6.65s	314	0
MiMo-V2-Flash	9.8	10.0	100.0%	0		75.68s	442	26,859

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		1.89s	243	0
MiMo-V2-Flash	6.5	10.0	50.0%	0		0ms	153	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0		1.17s	17	0
MiMo-V2-Flash	5.9	7.2	55.6%	1		96.01s	8,374	42,461

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	4.4	3.0	33.3%	1		2.26s	117	0
MiMo-V2-Flash	4.0	10.0	0.0%	0		4.20s	87	488

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		1.67s	72	0
MiMo-V2-Flash	10.0	10.0	100.0%	0		4.28s	75	3,504

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	7.7	10.0	66.7%	0		2.71s	494	0
MiMo-V2-Flash	7.7	10.0	66.7%	0		3.87s	864	1,948

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		3.33s	222	0
MiMo-V2-Flash	10.0	10.0	100.0%	0		27.78s	321	12,715

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		1.11s	11	0
MiMo-V2-Flash	3.0	10.0	0.0%	0		1.96s	12	0

Comparație rapidă

Schimbă perechea de comparație

Claude Sonnet 4.6nonevsMiMo-V2-Flashmedium Qwen3.6 Max PreviewnonevsMiMo-V2-Flashmedium DeepSeek V4 ProhighvsMiMo-V2-Flashmedium Step 3.7 FlashhighvsMiMo-V2-Flashmedium Mercury 2mediumvsQwen3.5 Plus 2026-02-15none Ring-2.6-1TnonevsMiMo-V2-Flashmedium Claude Opus 4.8nonevsMiMo-V2-Flashmedium GPT-5 NanomediumvsQwen3.5 Plus 2026-02-15none Kimi K2.5mediumvsQwen3.5 Plus 2026-02-15none Gemini 3.1 Flash LiteminimalvsQwen3.5 Plus 2026-02-15none Step 3.7 FlashlowvsMiMo-V2-Flashmedium GPT-5.3 ChatnonevsMiMo-V2-Flashmedium