AI BENCHY
Your ad here

AI BENCHY Categoriefouten

Toolaanroepen: API-fout

Toolaanroepen
API-fout

Zie welke AI-modellen op Toolaanroepen het meest kans hebben op API-fout, zodat je zwakke punten sneller ziet. Sorteren op: Responstijd (gem.) โ†“.

Getoonde modellen

6

Totaal fouten

6

Meest getroffen model

Gemma 4 31B 1
Rang Model Bedrijf API-fout-aantal Categoriescore Correcte tests Responstijd (gem.)
#14 Gemma 4 31B medium Google 1 3.0 0/1 0ms
#33 GLM 5.1 medium Z.ai 1 3.0 0/1 0ms
#48 Gemma 4 31B none Google 1 3.0 0/1 0ms
#56 Grok 4.20 Multi Agent Beta medium X AI 1 3.0 0/1 0ms
#84 gpt-oss-120b none OpenAI 1 3.0 0/1 0ms
#98 LFM2-24B-A2B none Liquid 1 3.0 0/1 0ms

Topmodellen op API-fout-aantal

API-fout-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten