AI BENCHY
Advertise here

AI BENCHY Fehler

API-Fehler-Fehler

Sieh, bei welchen KI-Modellen API-Fehler besonders häufig auftritt, damit du Zuverlässigkeitsrisiken vor der Auswahl erkennst. Sortieren nach: Korrekte Tests ↓.

Angezeigte Modelle

15

Gesamtfehler

144

Am stärksten betroffenes Modell

Gemini 3.5 Flash 3
Rang Modell Unternehmen API-Fehler-Anzahl Punktzahl Korrekte Tests Antwortzeit (Durchschnitt)
#100 Grok Build 0.1 none X AI 3 6.0 7/19 28.7s
#113 DeepSeek V4 Pro none DeepSeek 1 5.7 7/21 12.4s
#116 Hunter Alpha none OpenRouter 1 5.7 6/18 4.70s
#119 Cobuddy medium Baidu 1 5.6 7/21 39.9s
#120 Mimo V2 PRO none Xiaomi 1 5.6 7/21 2.27s
#107 Laguna Xs.2 medium Poolside 4 5.8 6/19 6.73s
#126 gpt-oss-120b none OpenAI 3 5.4 6/19 21.6s
#133 DeepSeek V3.2 none DeepSeek 4 5.2 6/21 13.8s
#136 Elephant Alpha medium Openrouter 3 5.1 6/21 1.27s
#138 Ling-2.6-flash none Inclusionai 2 5.0 6/21 9.34s
#146 Laguna Xs.2 none Poolside 4 4.8 5/19 806ms
#130 MiniMax M2.7 medium Minimax 1 5.3 5/21 38.2s
#132 Mistral Small 4 medium Mistral 2 5.3 5/21 9.40s
#137 Elephant Alpha none Openrouter 3 5.1 5/21 1.22s
#145 Laguna M.1 none Poolside 4 4.8 4/19 2.89s

Top-Modelle nach API-Fehler-Anzahl

API-Fehler-Anzahl vs Punktzahl

Top-Modelle nach Antwortzeit (Durchschnitt)