AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Kategoriefehler

Programmierung: API-Fehler

Programmierung
API-Fehler

Sieh, welche KI-Modelle bei Programmierung am ehesten auf API-Fehler stoßen, damit du Schwachstellen schneller erkennst. Sortieren nach: Antwortzeit (Durchschnitt) ↓.

Angezeigte Modelle

6

Gesamtfehler

6

Am stärksten betroffenes Modell

Gemini 3 PRO Preview 1
Rang Modell Unternehmen API-Fehler-Anzahl Kategorie-Score Korrekte Tests Antwortzeit (Durchschnitt)
#10 Gemini 3 PRO Preview medium Google 1 3.0 0/1 0ms
#18 Qwen3.6 Plus medium Qwen 1 3.0 0/1 0ms
#47 Hunter Alpha medium OpenRouter 1 3.0 0/1 0ms
#48 Nemotron 3 Super medium NVIDIA 1 3.0 0/1 0ms
#68 Hunter Alpha none OpenRouter 1 3.0 0/1 0ms
#93 Step 3.5 Flash none Stepfun 1 3.0 0/1 0ms

Top-Modelle nach API-Fehler-Anzahl

API-Fehler-Anzahl vs Punktzahl

Top-Modelle nach Antwortzeit (Durchschnitt)

Top-Modelle nach Geschätzte verschwendete Kosten