AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Kategoriefehler

Domänenspezifisch: Keine Antwort

Domänenspezifisch
Keine Antwort

Sieh, welche KI-Modelle bei Domänenspezifisch am ehesten auf Keine Antwort stoßen, damit du Schwachstellen schneller erkennst.

Angezeigte Modelle

5

Gesamtfehler

5

Am stärksten betroffenes Modell

Step 3.7 Flash 1
Rang Modell Unternehmen Keine Antwort-Anzahl Kategorie-Score Korrekte Tests Antwortzeit (Durchschnitt)
#71 Step 3.7 Flash high Stepfun 1 4.1 0/3 149.6s
#80 Mimo V2 Omni medium Xiaomi 1 3.0 0/3 47.9s
#107 Laguna Xs.2 medium Poolside 1 4.1 0/3 11.1s
#149 Nemotron 3 Nano Omni 30b A3b Reasoning medium NVIDIA 1 2.9 0/3 56.7s
#158 GLM 4.7 Flash medium Z.ai 1 3.5 0/3 174.6s

Top-Modelle nach Keine Antwort-Anzahl

Keine Antwort-Anzahl vs Punktzahl

Top-Modelle nach Antwortzeit (Durchschnitt)

Top-Modelle nach Geschätzte verschwendete Kosten