Ranking für Werkzeugaufrufe x Keine Antwort

Sieh, welche KI-Modelle bei Werkzeugaufrufe am ehesten auf Keine Antwort stoßen, damit du Schwachstellen schneller erkennst. Sortieren nach: Fehleranzahl ↑.

Angezeigte Modelle

Gesamtfehler

Am stärksten betroffenes Modell

GPT-5.2 1

Fehlergründe

API-Fehler17 Ungültiger Werkzeugaufruf9 Anweisungen nicht befolgt8 Falsche Antwort3 Keine Antwort2

Kategorien

Kombiniert29 Programmierung18 Allgemeinwissen13 Datenanalyse und -extraktion8 Domänenspezifisch8 Anti-KI-Tricks4 Rätsellösen3 Befolgung von Anweisungen2 Werkzeugaufrufe2

2/2

Rang	Modell	Unternehmen	Keine Antwort-Anzahl	Kategorie-Score	Gesamtkosten	Korrekte Tests	Antwortzeit (Durchschnitt)
#21	GPT-5.2 medium	OpenAI	1	4.7	$0.951	0/1	10.3s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.951 Antwortzeit (Durchschnitt) 10.3s
#185	Grok 4.1 Fast medium	X AI	1	2.8	$0.069	0/1	27.7s
Gesamttests 1 Falsche Tests 1 Gesamtkosten $0.069 Antwortzeit (Durchschnitt) 27.7s

Modelle filtern

Top-Modelle nach Keine Antwort-Anzahl

Keine Antwort-Anzahl vs Punktzahl

Top-Modelle nach Antwortzeit (Durchschnitt)

Top-Modelle nach Geschätzte verschwendete Kosten

Werkzeugaufrufe: Keine Antwort

Modelle filtern

Top-Modelle nach Keine Antwort-Anzahl

Keine Antwort-Anzahl vs Punktzahl

Top-Modelle nach Antwortzeit (Durchschnitt)

Top-Modelle nach Geschätzte verschwendete Kosten