Vergelijken Grafieken

Taal:

❤️ Made by XCS

AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-02-15 vs Xiaomi: MiMo-V2-Flash

Modelnaam:

Benchmarks gegenereerd uit AI BENCHY-testsuites op : 2026-02-27 15:16

Samenvatting

Metriek	Qwen: Qwen3.5 Plus 2026-02-15 medium Releasedatum: Onbekende releasedatum	Xiaomi: MiMo-V2-Flash medium Releasedatum: Onbekende releasedatum
Rang	#4	#21
Score	8.64	6.00
Consistentie	10.00	8.79
Kosten per resultaat	1.955	0.364
Totale kosten	$0.235	$0.030
Correcte tests
Foute tests	2	6
Slaagpercentage per poging	85.7%	64.3%
Instabiele tests	0	2
Uitvoer-tokens	1,258	11,650
Redeneer-tokens	93,374	93,283

Categorie-uitsplitsing

Anti-AI-trucs	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Uitvoer-tokens	Redeneer-tokens
Qwen: Qwen3.5 Plus 2026-02-15	10.00	10.00	100.0%	0		186	5,926
Xiaomi: MiMo-V2-Flash	9.67	9.99	100.0%	0		1,328	18,739

Gegevensparsering en extractie	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Uitvoer-tokens	Redeneer-tokens
Qwen: Qwen3.5 Plus 2026-02-15	10.00	10.00	100.0%	0		283	14,892
Xiaomi: MiMo-V2-Flash	5.50	10.00	50.0%	0		153	0

Domeinspecifiek	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Uitvoer-tokens	Redeneer-tokens
Qwen: Qwen3.5 Plus 2026-02-15	4.00	10.00	33.3%	0		56	39,882
Xiaomi: MiMo-V2-Flash	4.00	7.21	55.6%	1		8,363	51,202

Instructies opvolgen	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Uitvoer-tokens	Redeneer-tokens
Qwen: Qwen3.5 Plus 2026-02-15	9.50	9.99	100.0%	0		102	9,257
Xiaomi: MiMo-V2-Flash	9.50	9.99	100.0%	0		72	3,504

Puzzle Solving	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Uitvoer-tokens	Redeneer-tokens
Qwen: Qwen3.5 Plus 2026-02-15	10.00	10.00	100.0%	0		322	22,508
Xiaomi: MiMo-V2-Flash	1.00	7.14	11.1%	1		1,413	7,123

Toolaanroepen	Score	Consistentie	Slaagpercentage per poging	Instabiele tests	Correcte tests	Uitvoer-tokens	Redeneer-tokens
Qwen: Qwen3.5 Plus 2026-02-15	10.00	10.00	100.0%	0		309	909
Xiaomi: MiMo-V2-Flash	10.00	10.00	100.0%	0		321	12,715

Vergelijkingspaar wisselen

Vergelijk Qwen: Qwen3.5 Plus 2026-02-15 met...

Vergelijk Xiaomi: MiMo-V2-Flash met...