AI BENCHY
Vergelijken Grafieken Methodologie
โค๏ธ Made by XCS
Your ad here

AI BENCHY Fouten

Ongeldige toolaanroep-fouten

Zie welke AI-modellen het vaakst tegen Ongeldige toolaanroep aanlopen, zodat je betrouwbaarheidsrisico's ziet voordat je kiest. Sorteren op: Correcte tests โ†“.

Getoonde modellen

4

Totaal fouten

4

Meest getroffen model

DeepSeek V3.2 1

Verwante categorieรซn

Rang Model Bedrijf Ongeldige toolaanroep-aantal Gem. score Correcte tests Responstijd (gem.)
#33 DeepSeek V3.2 none DeepSeek 1 5.5 7/16 12.9s
#43 MiniMax M2.5 medium Minimax 1 4.7 5/16 43.0s
#49 GLM 4.7 Flash none Z.ai 1 3.9 4/16 2.99s
#52 GLM 4.7 Flash medium Z.ai 1 3.1 4/16 36.8s

Topmodellen op Ongeldige toolaanroep-aantal

Ongeldige toolaanroep-aantal vs gem. score

Topmodellen op Responstijd (gem.)