Bandingkan Grafik

Bahasa:

❤️ Made by XCS

AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-02-15 vs Xiaomi: MiMo-V2-Flash

Nama Model:

Benchmark dihasilkan dari suite pengujian AI BENCHY pada : 2026-02-27 15:16

Ringkasan

Metrik	Qwen: Qwen3.5 Plus 2026-02-15 none Rilis: Tanggal rilis tidak diketahui	Xiaomi: MiMo-V2-Flash medium Rilis: Tanggal rilis tidak diketahui
Peringkat	#15	#21
Skor	6.29	6.00
Konsistensi	9.99	8.79
Biaya per hasil	0.139	0.364
Total Biaya	$0.012	$0.030
Tes benar
Tes Salah	6	6
Tingkat lulus per percobaan	57.1%	64.3%
Tes tidak stabil	0	2
Token output	1,499	11,650
Token penalaran	0	93,283

Rincian Kategori

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Token output	Token penalaran
Qwen: Qwen3.5 Plus 2026-02-15	4.00	10.00	33.3%	0		514	0
Xiaomi: MiMo-V2-Flash	9.67	9.99	100.0%	0		1,328	18,739

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Token output	Token penalaran
Qwen: Qwen3.5 Plus 2026-02-15	10.00	10.00	100.0%	0		243	0
Xiaomi: MiMo-V2-Flash	5.50	10.00	50.0%	0		153	0

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Token output	Token penalaran
Qwen: Qwen3.5 Plus 2026-02-15	4.00	10.00	33.3%	0		15	0
Xiaomi: MiMo-V2-Flash	4.00	7.21	55.6%	1		8,363	51,202

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Token output	Token penalaran
Qwen: Qwen3.5 Plus 2026-02-15	9.50	10.00	100.0%	0		71	0
Xiaomi: MiMo-V2-Flash	9.50	9.99	100.0%	0		72	3,504

Puzzle Solving	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Token output	Token penalaran
Qwen: Qwen3.5 Plus 2026-02-15	5.00	9.96	33.3%	0		434	0
Xiaomi: MiMo-V2-Flash	1.00	7.14	11.1%	1		1,413	7,123

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Token output	Token penalaran
Qwen: Qwen3.5 Plus 2026-02-15	10.00	10.00	100.0%	0		222	0
Xiaomi: MiMo-V2-Flash	10.00	10.00	100.0%	0		321	12,715

Ganti Pasangan Perbandingan

Bandingkan Qwen: Qwen3.5 Plus 2026-02-15 dengan...

Bandingkan Xiaomi: MiMo-V2-Flash dengan...