AI BENCHY
Your ad here

AI BENCHY Fehler

Anweisungen nicht befolgt-Fehler

Sieh, bei welchen KI-Modellen Anweisungen nicht befolgt besonders häufig auftritt, damit du Zuverlässigkeitsrisiken vor der Auswahl erkennst. Sortieren nach: Fehleranzahl ↑.

Angezeigte Modelle

5

Gesamtfehler

180

Am stärksten betroffenes Modell

Qwen3.6 Plus Preview 1
Rang Modell Unternehmen Anweisungen nicht befolgt-Anzahl Punktzahl Korrekte Tests Antwortzeit (Durchschnitt)
#88 Nemotron 3 Super none NVIDIA 4 5.1 4/18 8.54s
#44 GPT-5.4 Mini medium OpenAI 5 7.3 9/18 15.2s
#84 gpt-oss-120b none OpenAI 5 5.2 4/18 12.0s
#92 Qwen3 Coder Next medium Qwen 5 4.7 3/18 10.8s
#80 MiniMax M2.7 medium Minimax 6 5.3 4/18 31.1s

Top-Modelle nach Anweisungen nicht befolgt-Anzahl

Anweisungen nicht befolgt-Anzahl vs Punktzahl

Top-Modelle nach Antwortzeit (Durchschnitt)