Granite 4.1 8B vs Qwen3.5-9B (medium)

Model yang direkomendasikan Granite 4.1 8B

It has the best score here (4.0), while costing about 5.7x less than Qwen3.5-9B (medium).

Perbandingan terperinci

Metrik	Granite 4.1 8B Granite 4.1 8B none Rilis: 2026-05-01	Qwen3.5-9B Qwen3.5-9B medium Rilis: 2026-03-02

Metrik	Granite 4.1 8B Granite 4.1 8B none Rilis: 2026-05-01	Qwen3.5-9B Qwen3.5-9B medium Rilis: 2026-03-02
Skor	4.0	3.8
Peringkat	#224	#227
Keandalan	10.0	5.0
Konsistensi	10.0	8.1
Tes benar
Tingkat lulus per percobaan	9.1%	25.8%
Tes tidak stabil	0	5
Total Run	66	66
Biaya per hasil	0.315	1.187
Total Biaya	$0.007	$0.036
Harga input	$0.050 / 1M	$0.100 / 1M
Harga output	$0.100 / 1M	$0.150 / 1M
Total token input	113,827	17,070
Token output	5,996	29,045
Token penalaran	0	209,516
Waktu respons (rata-rata)	1.45s	82.24s
Waktu respons (maks)	16.67s	226.38s
Waktu respons (total)	31.96s	1315.88s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

Kategori:

Trik anti-AI	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Granite 4.1 8B	4.9	10.0	25.0%	0		844ms	645	903	0
Qwen3.5-9B	5.1	5.8	50.0%	2		34.44s	369	2,621	12,411

Pemrograman	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Granite 4.1 8B	4.5	10.0	0.0%	0		775ms	8,344	525	0
Qwen3.5-9B	2.9	10.0	0.0%	0		100.88s	2,396	7,890	41,129

Gabungan	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Granite 4.1 8B	3.0	10.0	0.0%	0		9.28s	86,631	3,481	0
Qwen3.5-9B	3.0	10.0	0.0%	0		0ms	0	0	0

Parsing dan ekstraksi data	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Granite 4.1 8B	3.0	10.0	0.0%	0		575ms	7,617	195	0
Qwen3.5-9B	3.6	5.6	33.3%	1		87.31s	4,722	1,383	32,113

Spesifik domain	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Granite 4.1 8B	3.0	10.0	0.0%	0		357ms	768	24	0
Qwen3.5-9B	3.6	7.2	22.2%	1		137.75s	295	11,549	48,475

Kecerdasan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Granite 4.1 8B	4.0	10.0	0.0%	0		499ms	528	115	0
Qwen3.5-9B	2.8	1.6	33.3%	1		226.38s	180	0	30,695

Kepatuhan instruksi	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Granite 4.1 8B	3.6	9.9	0.0%	0		344ms	687	66	0
Qwen3.5-9B	6.5	10.0	50.0%	0		5.75s	381	491	1,824

Pemecahan teka-teki	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Granite 4.1 8B	3.2	10.0	0.0%	0		608ms	672	432	0
Qwen3.5-9B	3.0	10.0	0.0%	0		32.27s	376	1,593	12,026

Pemanggilan alat	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Granite 4.1 8B	10.0	10.0	100.0%	0		2.17s	7,719	243	0
Qwen3.5-9B	10.0	10.0	100.0%	0		4.31s	8,283	444	1,149

Pengetahuan umum	Skor	Konsistensi	Tingkat lulus per percobaan	Tes tidak stabil	Tes benar	Waktu respons (rata-rata)	Token input	Token output	Token penalaran
Granite 4.1 8B	3.0	10.0	0.0%	0		306ms	216	12	0
Qwen3.5-9B	3.0	10.0	0.0%	0		177.02s	68	3,074	29,694

Ganti Pasangan Perbandingan