Foutenranglijst voor Time-out

Zie welke AI-modellen het vaakst tegen Time-out aanlopen, zodat je betrouwbaarheidsrisico's ziet voordat je kiest.

Getoonde modellen

Totaal fouten

Meest getroffen model

Categorieën

In categorie Domeinspecifiek39 In categorie Programmeren25 In categorie Gecombineerd5 In categorie Puzzeloplossing5 In categorie Algemene intelligentie4 In categorie Anti-AI-trucs4 In categorie Gegevensparsering en extractie1 In categorie Instructies opvolgen1

41/41

Rang	Model	Bedrijf	Time-out-aantal	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#200	Qwen3.5-9B medium	Qwen	12	3.8	$0.036	3/22	82.2s
Totaal tests 22 Foute tests 19 Totale kosten $0.036 Responstijd (gem.) 82.2s
#79	Seed-2.0-Mini medium	Bytedance Seed	5	7.0	$0.101	11/22	92.5s
Totaal tests 22 Foute tests 11 Totale kosten $0.101 Responstijd (gem.) 92.5s
#115	Qwen3.5-35B-A3B medium	Qwen	5	6.2	$0.837	11/22	112.5s
Totaal tests 22 Foute tests 11 Totale kosten $0.837 Responstijd (gem.) 112.5s
#186	MiniMax M2.5 medium	Minimax	4	4.6	$0.340	5/22	68.3s
Totaal tests 22 Foute tests 17 Totale kosten $0.340 Responstijd (gem.) 68.3s
#31	GLM 5.2 high	Z.ai	3	8.0	$0.296	14/22	62.7s
Totaal tests 22 Foute tests 8 Totale kosten $0.296 Responstijd (gem.) 62.7s
#47	MiniMax M3 medium	Minimax	3	7.6	$0.286	12/22	75.0s
Totaal tests 22 Foute tests 10 Totale kosten $0.286 Responstijd (gem.) 75.0s
#52	Kimi K2.7 Code medium	Moonshot AI	3	7.5	$0.871	12/22	84.2s
Totaal tests 22 Foute tests 10 Totale kosten $0.871 Responstijd (gem.) 84.2s
#67	Kimi K2.6 medium	Moonshot AI	3	7.2	$1.222	12/22	110.0s
Totaal tests 22 Foute tests 10 Totale kosten $1.222 Responstijd (gem.) 110.0s
#110	Qwen3.5-Flash medium	Qwen	3	6.2	$0.139	12/22	84.8s
Totaal tests 22 Foute tests 10 Totale kosten $0.139 Responstijd (gem.) 84.8s
#33	Kimi K3 max	Moonshot AI	2	8.0	$3.112	16/22	122.5s
Totaal tests 22 Foute tests 6 Totale kosten $3.112 Responstijd (gem.) 122.5s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	2	7.5	$0.437	14/22	89.2s
Totaal tests 22 Foute tests 8 Totale kosten $0.437 Responstijd (gem.) 89.2s
#71	Qwen3.5-122B-A10B medium	Qwen	2	7.1	$1.046	14/22	64.2s
Totaal tests 22 Foute tests 8 Totale kosten $1.046 Responstijd (gem.) 64.2s
#73	GLM 5.1 medium	Z.ai	2	7.1	$0.535	13/22	46.8s
Totaal tests 22 Foute tests 9 Totale kosten $0.535 Responstijd (gem.) 46.8s
#75	DeepSeek V3.2 medium	DeepSeek	2	7.0	$0.078	11/22	68.6s
Totaal tests 22 Foute tests 11 Totale kosten $0.078 Responstijd (gem.) 68.6s
#76	Kimi K2.5 medium	Moonshot AI	2	7.0	$0.600	10/22	99.0s
Totaal tests 22 Foute tests 12 Totale kosten $0.600 Responstijd (gem.) 99.0s

Time-out-fouten

Modellen filteren

Topmodellen op Time-out-aantal

Time-out-aantal vs Score

Topmodellen op Responstijd (gem.)