AI BENCHY
Advertise here

AI BENCHY Fouten

Time-out-fouten

Zie welke AI-modellen het vaakst tegen Time-out aanlopen, zodat je betrouwbaarheidsrisico's ziet voordat je kiest. Sorteren op: Correcte tests โ†‘.

Getoonde modellen

4

Totaal fouten

73

Meest getroffen model

Qwen3.5-9B 11
Rang Model Bedrijf Time-out-aantal Score Correcte tests Responstijd (gem.)
#37 Gemma 4 26B A4B medium Google 2 7.6 14/21 63.4s
#17 GLM 5 medium Z.ai 1 8.3 15/21 33.5s
#18 Qwen3.7 Plus medium Qwen 1 8.2 15/21 38.9s
#11 Claude Opus 4.7 medium Anthropic 1 8.7 17/21 4.73s

Topmodellen op Time-out-aantal

Time-out-aantal vs Score

Topmodellen op Responstijd (gem.)