AI BENCHY
Advertise here

AI BENCHY Kategoriefehler

Allgemeinwissen: API-Fehler

Allgemeinwissen
API-Fehler

Sieh, welche KI-Modelle bei Allgemeinwissen am ehesten auf API-Fehler stoßen, damit du Schwachstellen schneller erkennst. Sortieren nach: Korrekte Tests ↓.

Angezeigte Modelle

12

Gesamtfehler

12

Am stärksten betroffenes Modell

Gemini 3 PRO Preview 1
Rang Modell Unternehmen API-Fehler-Anzahl Kategorie-Score Korrekte Tests Antwortzeit (Durchschnitt)
#35 Gemini 3 PRO Preview medium Google 1 3.0 0/1 0ms
#92 Laguna M.1 medium Poolside 1 3.0 0/1 0ms
#93 Qwen3.6 Plus Preview medium Qwen 1 3.0 0/1 0ms
#107 Laguna Xs.2 medium Poolside 1 3.0 0/1 0ms
#136 Elephant Alpha medium Openrouter 1 3.0 0/1 0ms
#137 Elephant Alpha none Openrouter 1 3.0 0/1 0ms
#145 Laguna M.1 none Poolside 1 3.0 0/1 0ms
#146 Laguna Xs.2 none Poolside 1 3.0 0/1 0ms
#149 Nemotron 3 Nano Omni 30b A3b Reasoning medium NVIDIA 1 3.0 0/1 0ms
#159 Ling-2.6-1T none Inclusionai 1 3.0 0/1 0ms
#161 Qwen3.5-9B medium Qwen 1 3.0 0/1 177.0s
#162 Nemotron 3 Nano Omni 30b A3b Reasoning none NVIDIA 1 3.0 0/1 0ms

Top-Modelle nach API-Fehler-Anzahl

API-Fehler-Anzahl vs Punktzahl

Top-Modelle nach Antwortzeit (Durchschnitt)

Top-Modelle nach Geschätzte verschwendete Kosten