Modelranglijst voor Instructies opvolgen

Zie welke AI-modellen het best presteren op Instructies opvolgen, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Responstijd (gem.) ↓.

Getoonde modellen

Gemiddelde Instructies opvolgen-score

8.6

Beste model

Kimi K2.5 10.0

Foutredenen

Met foutreden Verkeerd antwoord61 Met foutreden Instructies niet gevolgd19 Met foutreden Extra opmaak3 Met foutreden Geen antwoord2 Met foutreden API-fout1 Met foutreden Time-out1

216/216

Rang	Model	Bedrijf	Instructies opvolgen-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#144	Kimi K2.6 none	Moonshot AI	6.5	5.8	$0.184	1/2	1.64s
Totaal tests 2 Foute tests 1 Totale kosten $0.184 Responstijd (gem.) 1.64s
#164	KAT-Coder-Air V2.5 low	Kwaipilot	9.8	5.4	$0.041	2/2	1.64s
Totaal tests 2 Foute tests 0 Totale kosten $0.041 Responstijd (gem.) 1.64s
#104	Gemini 3.5 Flash-Lite medium	Google	9.8	6.5	$0.369	2/2	1.59s
Totaal tests 2 Foute tests 0 Totale kosten $0.369 Responstijd (gem.) 1.59s
#71	Step 3.7 Flash low	Stepfun	9.8	7.3	$0.454	2/2	1.58s
Totaal tests 2 Foute tests 0 Totale kosten $0.454 Responstijd (gem.) 1.58s
#93	Gemini 3 Flash Preview none	Google	6.4	6.8	$0.085	1/2	1.58s
Totaal tests 2 Foute tests 1 Totale kosten $0.085 Responstijd (gem.) 1.58s
#18	Claude Opus 4.7 medium	Anthropic	10.0	8.7	$1.477	2/2	1.57s
Totaal tests 2 Foute tests 0 Totale kosten $1.477 Responstijd (gem.) 1.57s
#111	Gemini 3.1 Flash Lite low	Google	10.0	6.5	$0.621	2/2	1.52s
Totaal tests 2 Foute tests 0 Totale kosten $0.621 Responstijd (gem.) 1.52s
#179	DeepSeek V3.2 none	DeepSeek	10.0	5.0	$0.054	2/2	1.52s
Totaal tests 2 Foute tests 0 Totale kosten $0.054 Responstijd (gem.) 1.52s
#90	Step 3.7 Flash high	Stepfun	9.8	6.9	$1.207	2/2	1.52s
Totaal tests 2 Foute tests 0 Totale kosten $1.207 Responstijd (gem.) 1.52s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	9.8	5.6	$0.077	2/2	1.51s
Totaal tests 2 Foute tests 0 Totale kosten $0.077 Responstijd (gem.) 1.51s
#155	KAT-Coder-Air V2.5 medium	Kwaipilot	10.0	5.6	$0.048	2/2	1.50s
Totaal tests 2 Foute tests 0 Totale kosten $0.048 Responstijd (gem.) 1.50s
#110	Gemini 3.1 Flash Lite Preview low	Google	10.0	6.5	$0.646	2/2	1.49s
Totaal tests 2 Foute tests 0 Totale kosten $0.646 Responstijd (gem.) 1.49s
#59	GPT-5.6 Terra low	OpenAI	10.0	7.5	$0.519	2/2	1.48s
Totaal tests 2 Foute tests 0 Totale kosten $0.519 Responstijd (gem.) 1.48s
#147	GLM 5 none	Z.ai	10.0	5.7	$0.041	2/2	1.48s
Totaal tests 2 Foute tests 0 Totale kosten $0.041 Responstijd (gem.) 1.48s
#135	Nemotron 3 Ultra none	NVIDIA	10.0	6.1	$0.095	2/2	1.46s
Totaal tests 2 Foute tests 0 Totale kosten $0.095 Responstijd (gem.) 1.46s

Instructies opvolgen-ranglijst

Modellen filteren

Topmodellen op Instructies opvolgen-score

Instructies opvolgen-score vs totale kosten

Topmodellen op Responstijd (gem.)