Foutenranglijst voor Time-out

AI BENCHY Fouten

Zie welke AI-modellen het vaakst tegen Time-out aanlopen, zodat je betrouwbaarheidsrisico's ziet voordat je kiest. Sorteren op: Correcte tests ↑.

Getoonde modellen

Totaal fouten

Meest getroffen model

Categorieën

In categorie Domeinspecifiek34 In categorie Programmeren23 In categorie Puzzeloplossing5 In categorie Algemene intelligentie4 In categorie Anti-AI-trucs4 In categorie Gecombineerd2 In categorie Gegevensparsering en extractie1

Rang	Model	Bedrijf	Time-out-aantal	Score	Correcte tests	Responstijd (gem.)
#37	Gemma 4 26B A4B medium	Google	2	7.6	14/21	63.4s
#17	GLM 5 medium	Z.ai	1	8.3	15/21	33.5s
#18	Qwen3.7 Plus medium	Qwen	1	8.2	15/21	38.9s
#11	Claude Opus 4.7 medium	Anthropic	1	8.7	17/21	4.73s

Time-out-fouten