#66

Qwen3.5-9B

Qwen · Veröffentlichung: 2026-03-02 · qwen/qwen3.5-9b::medium

2.6

Kosten pro Ergebnis

0.779

Konsistenz

7.4

$0.024

Falsche Tests: 13

Erfolgsquote pro Versuch: 35.4%

Instabile Tests

5

Instabile Tests hatten gemischte Ergebnisse über Läufe hinweg (mindestens ein Erfolg und ein Fehlschlag).

Antwortzeit (Durchschnitt)

71.44s

Antwortzeit (Maximum): 226.38s

Antwortzeit (Gesamt): 928.77s

Zeitüberschreitung: 10 Zusätzliche Formatierung: 1 Anweisungen nicht befolgt: 1 Falsche Antwort: 1

Diagramme

Wähle zuerst das erste Modell und klicke dann ein zweites Modell, um eine Seite im direkten Vergleich zu öffnen.

Top-Modelle nach Score

Ø-Score vs Gesamtkosten

Antwortzeit (Durchschnitt)

Ø-Score vs Antwortzeit (Durchschnitt)

Gesamte Ausgabe-Token

Ø-Score vs Gesamte Ausgabe-Token

Schnellvergleich

Qwen3.5-9BmediumvsGrok 4.1 Fastnone Qwen3.5-9BmediumvsGLM 4.7 Flashmedium Qwen3.5-9BmediumvsMercury 2none Qwen3.5-9BmediumvsGemini 3 Flash Previewmedium Qwen3.5-9BmediumvsGemini 3.1 Pro Previewmedium Qwen3.5-9BmediumvsStep 3.5 FlashmediumKostenlos verfügbar

Kategorieaufschlüsselung

Kategorie	Ø-Score	Konsistenz	Korrekte Tests
Anti-KI-Tricks	4.0	7.2
Kombiniert	10.0	10.0
Datenanalyse und -extraktion	5.0	5.6
Domänenspezifisch	10.0	7.2
Allgemeine Intelligenz	10.0	1.6
Befolgung von Anweisungen	5.5	5.8
Rätsellösen	10.0	10.0
Werkzeugaufrufe	10.0	10.0

Verglichene Modelle