AI BENCHY Compare

Mistral: Mistral Small 4 vs Qwen: Qwen3 Coder Next

Benchmark dihasilkan dari suite pengujian AI BENCHY pada: 2026-04-04

Metrik	Mistral Small 4 Mistral Small 4 none Rilis: 2026-03-16	Qwen3 Coder Next Qwen3 Coder Next none Rilis: 2026-02-03

Metrik	Mistral Small 4 Mistral Small 4 none Rilis: 2026-03-16	Qwen3 Coder Next Qwen3 Coder Next none Rilis: 2026-02-03
Skor	5.3	5.0
Peringkat	#75	#79
Konsistensi	9.5	10.0
Tes benar
Tingkat lulus per percobaan	33.3%	23.5%
Tes tidak stabil	1	0
Total Run	51	51
Biaya per hasil	0.108	0.175
Total Biaya	$0.006	$0.007
Harga input	$0.150 / 1M	$0.120 / 1M
Harga output	$0.600 / 1M	$0.750 / 1M
Token output	1,624	3,032
Token penalaran	0	0
Waktu respons (rata-rata)	629ms	10.82s
Waktu respons (maks)	1.72s	45.14s
Waktu respons (total)	10.70s	118.99s

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Rincian Kategori

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Mistral Small 4	3.4	7.9	16.7%	1		395ms	182	0
Qwen3 Coder Next	3.6	10.0	0.0%	0		3.31s	1,321	0

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Mistral Small 4	3.0	10.0	0.0%	0		1.72s	496	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		45.14s	317	0

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Mistral Small 4	10.0	10.0	100.0%	0		822ms	261	0
Qwen3 Coder Next	6.5	10.0	50.0%	0		1.32s	246	0

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Mistral Small 4	5.3	10.0	33.3%	0		367ms	28	0
Qwen3 Coder Next	5.3	10.0	33.3%	0		962ms	26	0

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Mistral Small 4	4.0	10.0	0.0%	0		729ms	205	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		1.34s	152	0

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Mistral Small 4	6.5	10.0	50.0%	0		380ms	69	0
Qwen3 Coder Next	4.8	10.0	0.0%	0		7.71s	63	0

Puzzle Solving	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Mistral Small 4	3.1	9.9	0.0%	0		589ms	170	0
Qwen3 Coder Next	3.2	10.0	0.0%	0		22.86s	652	0

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token output	Token penalaran
Mistral Small 4	10.0	10.0	100.0%	0		1.40s	213	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	255	0

Perbandingan Cepat

Ganti Pasangan Perbandingan

MiniMax M2.7mediumvsQwen3 Coder Nextnone MiniMax M2.7mediumvsMistral Small 4none Qwen3 Coder NextnonevsGLM 4.7 Flashmedium Mistral Small 4nonevsQwen3 Coder Nextmedium Mistral Small 4nonevsGLM 4.7 Flashmedium Mistral Small 4mediumvsQwen3 Coder Nextnone MiniMax M2.5mediumTersedia gratisvsMistral Small 4none Mistral Small 4nonevsgpt-oss-120bmediumTersedia gratis Mistral Small 4nonevsQwen3.5-9Bmedium MiniMax M2.5mediumTersedia gratisvsQwen3 Coder Nextnone Mistral Small 4nonevsGrok 4.20 Multi Agent Betamedium gpt-oss-120bmediumTersedia gratisvsQwen3 Coder Nextnone