Claude Sonnet 4.6 (medium) vs Qwen3.6 Plus (medium)

Empfohlenes Modell Qwen3.6 Plus (medium)

Es hat hier die beste Punktzahl (7.8) und kostet etwa 5.1x weniger als Claude Sonnet 4.6 (medium).

Detaillierter Vergleich

Metrik	Claude Sonnet 4.6 Claude Sonnet 4.6 medium Veröffentlichung: 2026-02-17	Qwen3.6 Plus Qwen3.6 Plus medium Veröffentlichung: 2026-04-20

Metrik	Claude Sonnet 4.6 Claude Sonnet 4.6 medium Veröffentlichung: 2026-02-17	Qwen3.6 Plus Qwen3.6 Plus medium Veröffentlichung: 2026-04-20
Punktzahl	7.8	7.8
Rang	#47	#44
Zuverlässigkeit	10.0	10.0
Konsistenz	9.2	9.3
Korrekte Tests
Erfolgsquote pro Versuch	66.7%	71.2%
Instabile Tests	2	2
Gesamtläufe	66	66
Kosten pro Ergebnis	14.692	1.514
Gesamtkosten	$2.057	$0.405
Eingabepreis	$3.000 / 1M	$0.325 / 1M
Ausgabepreis	$15.000 / 1M	$1.950 / 1M
Gesamte Eingabe-Token	106,292	97,689
Ausgabe-Token	80,748	6,412
Denk-Token	35,117	184,825
Antwortzeit (Durchschnitt)	25.91s	43.12s
Antwortzeit (Maximum)	140.96s	291.55s
Antwortzeit (Gesamt)	362.78s	905.53s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

Ungültiges SVG

medium

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 4.6	6.5	10.0	50.0%	0		2.98s	789	1,046	1,093
Qwen3.6 Plus	10.0	10.0	100.0%	0		9.90s	672	207	7,557

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 4.6	5.7	6.6	44.4%	1		33.29s	6,995	16,089	3,686
Qwen3.6 Plus	6.1	7.8	44.4%	1		153.12s	7,098	58	50,586

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 4.6	10.0	10.0	100.0%	0		93.65s	75,531	31,916	9,109
Qwen3.6 Plus	10.0	10.0	100.0%	0		163.25s	71,058	5,011	55,925

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 4.6	10.0	10.0	100.0%	0		13.90s	8,676	649	742
Qwen3.6 Plus	10.0	10.0	100.0%	0		14.95s	7,782	270	10,706

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 4.6	2.9	7.2	11.1%	1		0ms	471	25,790	16,919
Qwen3.6 Plus	2.9	7.2	11.1%	1		29.59s	771	56	33,464

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.94s	564	256	433
Qwen3.6 Plus	5.1	10.0	0.0%	0		27.05s	516	111	5,232

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 4.6	10.0	10.0	100.0%	0		2.61s	792	318	552
Qwen3.6 Plus	10.0	10.0	100.0%	0		7.54s	699	102	5,552

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 4.6	10.0	10.0	100.0%	0		5.31s	816	592	646
Qwen3.6 Plus	10.0	10.0	100.0%	0		6.34s	696	309	6,712

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 4.6	10.0	10.0	100.0%	0		7.48s	11,454	655	351
Qwen3.6 Plus	10.0	10.0	100.0%	0		5.87s	8,193	267	1,330

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Sonnet 4.6	3.0	10.0	0.0%	0		30.09s	204	3,437	1,586
Qwen3.6 Plus	3.0	10.0	0.0%	0		47.51s	204	21	7,761

Vergleichspaar wechseln