Ranglijst voor Domeinspecifiek x Time-out

Zie welke AI-modellen op Domeinspecifiek het meest kans hebben op Time-out, zodat je zwakke punten sneller ziet. Sorteren op: Responstijd (gem.) ↓.

Getoonde modellen

Totaal fouten

Meest getroffen model

Kimi K3 2

Foutredenen

Verkeerd antwoord412 Time-out43 Extra opmaak17 Geen antwoord8 API-fout7 Instructies niet gevolgd1

Categorieën

Domeinspecifiek43 Programmeren26 Gecombineerd5 Puzzeloplossing5 Algemene intelligentie4 Anti-AI-trucs4 Gegevensparsering en extractie1 Instructies opvolgen1

32/32

Rang	Model	Bedrijf	Time-out-aantal	Categoriescore	Totale kosten	Correcte tests	Responstijd (gem.)
#33	Kimi K3 max	Moonshot AI	2	5.9	$3.112	1/3	490.1s
Totaal tests 3 Foute tests 2 Totale kosten $3.112 Responstijd (gem.) 490.1s
#97	LongCat 2.0 high	Meituan	2	3.6	$0.469	0/3	400.3s
Totaal tests 3 Foute tests 3 Totale kosten $0.469 Responstijd (gem.) 400.3s
#60	LongCat 2.0 medium	Meituan	1	2.9	$0.478	0/3	339.9s
Totaal tests 3 Foute tests 3 Totale kosten $0.478 Responstijd (gem.) 339.9s
#190	MiniMax M2.5 medium	Minimax	1	2.9	$0.340	0/3	237.3s
Totaal tests 3 Foute tests 3 Totale kosten $0.340 Responstijd (gem.) 237.3s
#47	MiniMax M3 medium	Minimax	2	5.5	$0.286	1/3	233.1s
Totaal tests 3 Foute tests 2 Totale kosten $0.286 Responstijd (gem.) 233.1s
#52	Kimi K2.7 Code medium	Moonshot AI	2	5.5	$0.751	1/3	213.3s
Totaal tests 3 Foute tests 2 Totale kosten $0.751 Responstijd (gem.) 213.3s
#128	GPT-5 Nano medium	OpenAI	1	5.2	$0.114	1/3	204.0s
Totaal tests 3 Foute tests 2 Totale kosten $0.114 Responstijd (gem.) 204.0s
#68	Kimi K2.6 medium	Moonshot AI	2	5.3	$1.036	1/3	202.4s
Totaal tests 3 Foute tests 2 Totale kosten $1.036 Responstijd (gem.) 202.4s
#114	Qwen3.5-Flash medium	Qwen	1	5.3	$0.139	1/3	146.5s
Totaal tests 3 Foute tests 2 Totale kosten $0.139 Responstijd (gem.) 146.5s
#204	Qwen3.5-9B medium	Qwen	3	3.6	$0.036	0/3	137.7s
Totaal tests 3 Foute tests 3 Totale kosten $0.036 Responstijd (gem.) 137.7s
#77	Kimi K2.5 medium	Moonshot AI	1	3.5	$0.600	0/3	137.3s
Totaal tests 3 Foute tests 3 Totale kosten $0.600 Responstijd (gem.) 137.3s
#185	Grok 4.1 Fast medium	X AI	1	5.8	$0.069	1/3	121.8s
Totaal tests 3 Foute tests 2 Totale kosten $0.069 Responstijd (gem.) 121.8s
#119	Qwen3.5-35B-A3B medium	Qwen	2	4.1	$0.837	0/3	88.3s
Totaal tests 3 Foute tests 3 Totale kosten $0.837 Responstijd (gem.) 88.3s
#91	LongCat 2.0 low	Meituan	1	3.0	$0.391	0/3	86.1s
Totaal tests 3 Foute tests 3 Totale kosten $0.391 Responstijd (gem.) 86.1s
#58	Qwen3.5-27B medium	Qwen	1	5.3	$1.627	1/3	79.5s
Totaal tests 3 Foute tests 2 Totale kosten $1.627 Responstijd (gem.) 79.5s

Modellen filteren

Topmodellen op Time-out-aantal

Time-out-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten

Domeinspecifiek: Time-out

Modellen filteren

Topmodellen op Time-out-aantal

Time-out-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten