Navigation
AI BENCHY
Your ad here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs Qwen3.6 Plus

Benchmarks aus AI BENCHY-Test-Suites generiert am: 2026-04-02

Metrik Claude Sonnet 4.6 Claude Sonnet 4.6 none Veröffentlichung: 2026-02-17 Qwen3.6 Plus Qwen3.6 Plus medium Veröffentlichung: 2026-04-02 Kostenlos verfügbar
Punktzahl 7.3 8.4
Rang #38 #9
Konsistenz 9.6 9.5
Korrekte Tests
Erfolgsquote pro Versuch 62.8% 78.4%
Instabile Tests 1 1
Gesamtläufe 51 51
Kosten pro Ergebnis 2.512 0.000
Gesamtkosten $0.252 $0.000
Eingabepreis $3.000 / 1M $0.000 / 1M
Ausgabepreis $15.000 / 1M $0.000 / 1M
Ausgabe-Token 6,910 1,763
Denk-Token 0 83,782
Antwortzeit (Durchschnitt) 5.12s 15.27s
Antwortzeit (Maximum) 23.84s 43.55s
Antwortzeit (Gesamt) 51.16s 259.55s

Top-Modelle nach Score

Score vs. Gesamtkosten

Antwortzeit (Durchschnitt)

Punktzahl vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Punktzahl vs Gesamte Ausgabe-Token

Kategorieaufschlüsselung

Anti-KI-Tricks Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 1,214 0
Qwen3.6 Plus 10.0 10.0 100.0% 0 9.90s 207 7,557
Kombiniert Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 3,766 0
Qwen3.6 Plus 10.0 10.0 100.0% 0 34.95s 452 13,073
Datenanalyse und -extraktion Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 252 0
Qwen3.6 Plus 10.0 10.0 100.0% 0 14.95s 270 10,706
Domänenspezifisch Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 413 0
Qwen3.6 Plus 2.9 7.2 11.1% 1 29.59s 56 33,464
Allgemeine Intelligenz Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 192 0
Qwen3.6 Plus 5.1 10.0 0.0% 0 27.05s 111 5,232
Befolgung von Anweisungen Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 90 0
Qwen3.6 Plus 10.0 10.0 100.0% 0 7.54s 102 5,552
Puzzle Solving Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.92s 536 0
Qwen3.6 Plus 10.0 10.0 100.0% 0 6.11s 298 6,868
Werkzeugaufrufe Punktzahl Konsistenz Erfolgsquote pro Versuch Instabile Tests Korrekte Tests Antwortzeit (Durchschnitt) Ausgabe-Token Denk-Token
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 447 0
Qwen3.6 Plus 10.0 10.0 100.0% 0 5.87s 267 1,330

Schnellvergleich

Vergleichspaar wechseln