AI BENCHY
Advertise here

AI BENCHY Categoriefouten

Gecombineerd: Ongeldige toolaanroep

Gecombineerd
Ongeldige toolaanroep

Zie welke AI-modellen op Gecombineerd het meest kans hebben op Ongeldige toolaanroep, zodat je zwakke punten sneller ziet.

Getoonde modellen

4

Totaal fouten

19

Meest getroffen model

Gemini 3.5 Flash 1

Categorieรซn

Rang Model Bedrijf Ongeldige toolaanroep-aantal Categoriescore Correcte tests Responstijd (gem.)
#145 Laguna M.1 none Poolside 1 3.0 0/1 4.32s
#154 Qwen3.5-9B none Qwen 1 3.0 0/1 5.91s
#158 GLM 4.7 Flash medium Z.ai 1 2.8 0/1 65.6s
#163 Granite 4.1 8B none IBM Granite 1 3.0 0/1 1.88s

Topmodellen op Ongeldige toolaanroep-aantal

Ongeldige toolaanroep-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten