Ranking für Befolgung von Anweisungen x API-Fehler

Sieh, welche KI-Modelle bei Befolgung von Anweisungen am ehesten auf API-Fehler stoßen, damit du Schwachstellen schneller erkennst. Sortieren nach: Korrekte Tests ↓.

Angezeigte Modelle

Gesamtfehler

Am stärksten betroffenes Modell

Qwen3.6 Plus Preview 1

Fehlergründe

Falsche Antwort61 Anweisungen nicht befolgt18 Zusätzliche Formatierung3 Keine Antwort2 API-Fehler1 Zeitüberschreitung1

Kategorien

Programmierung45 Kombiniert26 Werkzeugaufrufe17 Anti-KI-Tricks14 Datenanalyse und -extraktion14 Allgemeinwissen13 Allgemeine Intelligenz12 Rätsellösen12 Domänenspezifisch7 Befolgung von Anweisungen1

1/1

Rang	Modell	Unternehmen	API-Fehler-Anzahl	Kategorie-Score	Gesamtkosten	Korrekte Tests	Antwortzeit (Durchschnitt)
#175	Qwen3.6 Plus Preview medium	Qwen	1	6.5	$0.000	1/2	3.40s
Gesamttests 2 Falsche Tests 1 Gesamtkosten $0.000 Antwortzeit (Durchschnitt) 3.40s

Modelle filtern

Top-Modelle nach API-Fehler-Anzahl

API-Fehler-Anzahl vs Punktzahl

Top-Modelle nach Antwortzeit (Durchschnitt)

Top-Modelle nach Geschätzte verschwendete Kosten

Befolgung von Anweisungen: API-Fehler

Modelle filtern

Top-Modelle nach API-Fehler-Anzahl

API-Fehler-Anzahl vs Punktzahl

Top-Modelle nach Antwortzeit (Durchschnitt)

Top-Modelle nach Geschätzte verschwendete Kosten