Claude Opus 4.7 (medium) vs Qwen3.6 Max Preview (medium)

Empfohlenes Modell Claude Opus 4.7 (medium)

Es hat hier die beste Punktzahl (8.7) und antwortet etwa 8.9x schneller als Qwen3.6 Max Preview (medium).

Detaillierter Vergleich

Metrik	Claude Opus 4.7 Claude Opus 4.7 medium Veröffentlichung: 2026-04-16	Qwen3.6 Max Preview Qwen3.6 Max Preview medium Veröffentlichung: 2026-04-20

Metrik	Claude Opus 4.7 Claude Opus 4.7 medium Veröffentlichung: 2026-04-16	Qwen3.6 Max Preview Qwen3.6 Max Preview medium Veröffentlichung: 2026-04-20
Punktzahl	8.7	8.4
Rang	#20	#25
Zuverlässigkeit	10.0	9.9
Konsistenz	9.6	8.9
Korrekte Tests
Erfolgsquote pro Versuch	83.3%	80.3%
Instabile Tests	1	3
Gesamtläufe	66	66
Kosten pro Ergebnis	8.201	8.173
Gesamtkosten	$1.477	$1.143
Eingabepreis	$5.000 / 1M	$1.040 / 1M
Ausgabepreis	$25.000 / 1M	$6.240 / 1M
Gesamte Eingabe-Token	145,252	79,240
Ausgabe-Token	24,948	5,098
Denk-Token	5,042	164,842
Antwortzeit (Durchschnitt)	7.61s	67.53s
Antwortzeit (Maximum)	65.40s	238.07s
Antwortzeit (Gesamt)	159.91s	1485.64s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

medium

Kategorie:

Anti-KI-Tricks	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	894	348	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		22.13s	672	228	10,075

Programmierung	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	7.6	7.2	77.8%	1		12.96s	10,635	7,629	1,114
Qwen3.6 Max Preview	8.8	7.8	88.9%	1		146.48s	7,895	427	52,957

Kombiniert	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		43.42s	104,347	15,459	3,928
Qwen3.6 Max Preview	7.3	5.8	83.3%	1		177.48s	51,812	3,215	35,050

Datenanalyse und -extraktion	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	10,533	324	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		41.15s	7,782	270	10,106

Domänenspezifisch	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	630	51	0
Qwen3.6 Max Preview	2.9	7.2	11.1%	1		95.91s	771	60	30,371

Allgemeine Intelligenz	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	723	256	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		32.24s	516	129	3,510

Befolgung von Anweisungen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	939	114	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		24.31s	699	103	5,848

Rätsellösen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		2.43s	939	370	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		24.32s	696	329	7,693

Werkzeugaufrufe	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	15,339	373	0
Qwen3.6 Max Preview	10.0	10.0	100.0%	0		18.32s	8,193	309	1,571

Allgemeinwissen	Punktzahl	Konsistenz	Erfolgsquote pro Versuch	Instabile Tests	Korrekte Tests	Antwortzeit (Durchschnitt)	Eingabe-Token	Ausgabe-Token	Denk-Token
Claude Opus 4.7	3.0	10.0	0.0%	0		2.25s	273	24	0
Qwen3.6 Max Preview	3.0	10.0	0.0%	0		60.56s	204	28	7,661

Vergleichspaar wechseln