AI BENCHY
Your ad here

AI BENCHY Categoriefouten

Toolaanroepen: Ongeldige toolaanroep

Toolaanroepen
Ongeldige toolaanroep

Zie welke AI-modellen op Toolaanroepen het meest kans hebben op Ongeldige toolaanroep, zodat je zwakke punten sneller ziet. Sorteren op: Correcte tests โ†‘.

Getoonde modellen

3

Totaal fouten

3

Meest getroffen model

GLM 5V Turbo 1

Categorieรซn

Rang Model Bedrijf Ongeldige toolaanroep-aantal Categoriescore Correcte tests Responstijd (gem.)
#31 GLM 5V Turbo medium Z.ai 1 7.0 0/1 12.5s
#81 Elephant medium Openrouter 1 3.0 0/1 2.83s
#85 Elephant none Openrouter 1 3.0 0/1 2.79s

Topmodellen op Ongeldige toolaanroep-aantal

Ongeldige toolaanroep-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten