Granite 4.1 8B vs Qwen3 Coder Next (medium)

Empfohlenes Modell Qwen3 Coder Next (medium)

Es hat die stärkste Punktzahl in diesem Vergleich (4.7) und die beste Gesamtbalance aus Kosten und Antwortzeit über alle 2 Modelle.

Detaillierter Vergleich

Metrik	Granite 4.1 8B Granite 4.1 8B none Veröffentlichung: 2026-05-01	Qwen3 Coder Next Qwen3 Coder Next medium Veröffentlichung: 2026-02-03

Metrik	Granite 4.1 8B Granite 4.1 8B none Veröffentlichung: 2026-05-01	Qwen3 Coder Next Qwen3 Coder Next medium Veröffentlichung: 2026-02-03
Punktzahl	4.0	4.7
Rang	#224	#209
Zuverlässigkeit	10.0	10.0
Konsistenz	10.0	9.0
Korrekte Tests
Erfolgsquote pro Versuch	9.1%	27.3%
Instabile Tests	0	3
Gesamtläufe	66	66
Kosten pro Ergebnis	0.315	0.793
Gesamtkosten	$0.007	$0.032
Eingabepreis	$0.050 / 1M	$0.110 / 1M
Ausgabepreis	$0.100 / 1M	$0.800 / 1M
Gesamte Eingabe-Token	113,827	148,194
Ausgabe-Token	5,996	19,069
Denk-Token	0	0
Antwortzeit (Durchschnitt)	1.45s	9.61s
Antwortzeit (Maximum)	16.67s	81.80s
Antwortzeit (Gesamt)	31.96s	153.69s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

Ungültiges SVG

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Granite 4.1 8B	4.9	10.0	25.0%	0		844ms	645	903	0
Qwen3 Coder Next	3.5	8.1	16.7%	1		8.64s	645	1,252	0

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Granite 4.1 8B	4.5	10.0	0.0%	0		775ms	8,344	525	0
Qwen3 Coder Next	3.7	7.2	22.2%	1		924ms	7,185	336	0

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Granite 4.1 8B	3.0	10.0	0.0%	0		9.28s	86,631	3,481	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		14.65s	121,413	16,067	0

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Granite 4.1 8B	3.0	10.0	0.0%	0		575ms	7,617	195	0
Qwen3 Coder Next	6.5	10.0	50.0%	0		81.80s	7,758	246	0

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Granite 4.1 8B	3.0	10.0	0.0%	0		357ms	768	24	0
Qwen3 Coder Next	5.3	10.0	33.3%	0		638ms	753	25	0

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Granite 4.1 8B	4.0	10.0	0.0%	0		499ms	528	115	0
Qwen3 Coder Next	6.3	3.4	66.7%	1		1.39s	498	142	0

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Granite 4.1 8B	3.6	9.9	0.0%	0		344ms	687	66	0
Qwen3 Coder Next	6.3	10.0	50.0%	0		7.49s	684	63	0

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Granite 4.1 8B	3.2	10.0	0.0%	0		608ms	672	432	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		1.25s	678	671	0

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Granite 4.1 8B	10.0	10.0	100.0%	0		2.17s	7,719	243	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.64s	8,364	255	0

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Granite 4.1 8B	3.0	10.0	0.0%	0		306ms	216	12	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		399ms	216	12	0

Vergleichspaar wechseln