Modelranglijst voor Instructies opvolgen

Zie welke AI-modellen het best presteren op Instructies opvolgen, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Responstijd (gem.) ↑.

Getoonde modellen

Gemiddelde Instructies opvolgen-score

8.6

Beste model

Granite 4.1 8B 3.6

Foutredenen

Met foutreden Verkeerd antwoord61 Met foutreden Instructies niet gevolgd19 Met foutreden Extra opmaak3 Met foutreden Geen antwoord2 Met foutreden API-fout1 Met foutreden Time-out1

216/216

Rang	Model	Bedrijf	Instructies opvolgen-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#70	Claude Opus 4.8 none	Anthropic	9.9	7.3	$1.166	2/2	1.37s
Totaal tests 2 Foute tests 0 Totale kosten $1.166 Responstijd (gem.) 1.37s
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	7.3	3.4	$0.000	1/2	1.37s
Totaal tests 2 Foute tests 1 Totale kosten $0.000 Responstijd (gem.) 1.37s
#173	Mistral Small 4 medium	Mistral	7.3	5.1	$0.096	1/2	1.38s
Totaal tests 2 Foute tests 1 Totale kosten $0.096 Responstijd (gem.) 1.38s
#103	Qwen3.6 Max Preview none	Qwen	9.8	6.6	$0.231	2/2	1.40s
Totaal tests 2 Foute tests 0 Totale kosten $0.231 Responstijd (gem.) 1.40s
#43	GPT-5.6 Terra medium	OpenAI	10.0	7.8	$0.676	2/2	1.43s
Totaal tests 2 Foute tests 0 Totale kosten $0.676 Responstijd (gem.) 1.43s
#99	Claude Opus 4.7 none	Anthropic	10.0	6.6	$0.505	2/2	1.46s
Totaal tests 2 Foute tests 0 Totale kosten $0.505 Responstijd (gem.) 1.46s
#135	Nemotron 3 Ultra none	NVIDIA	10.0	6.1	$0.095	2/2	1.46s
Totaal tests 2 Foute tests 0 Totale kosten $0.095 Responstijd (gem.) 1.46s
#147	GLM 5 none	Z.ai	10.0	5.7	$0.041	2/2	1.48s
Totaal tests 2 Foute tests 0 Totale kosten $0.041 Responstijd (gem.) 1.48s
#59	GPT-5.6 Terra low	OpenAI	10.0	7.5	$0.519	2/2	1.48s
Totaal tests 2 Foute tests 0 Totale kosten $0.519 Responstijd (gem.) 1.48s
#110	Gemini 3.1 Flash Lite Preview low	Google	10.0	6.5	$0.646	2/2	1.49s
Totaal tests 2 Foute tests 0 Totale kosten $0.646 Responstijd (gem.) 1.49s
#155	KAT-Coder-Air V2.5 medium	Kwaipilot	10.0	5.6	$0.048	2/2	1.50s
Totaal tests 2 Foute tests 0 Totale kosten $0.048 Responstijd (gem.) 1.50s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	9.8	5.6	$0.077	2/2	1.51s
Totaal tests 2 Foute tests 0 Totale kosten $0.077 Responstijd (gem.) 1.51s
#90	Step 3.7 Flash high	Stepfun	9.8	6.9	$1.207	2/2	1.52s
Totaal tests 2 Foute tests 0 Totale kosten $1.207 Responstijd (gem.) 1.52s
#179	DeepSeek V3.2 none	DeepSeek	10.0	5.0	$0.054	2/2	1.52s
Totaal tests 2 Foute tests 0 Totale kosten $0.054 Responstijd (gem.) 1.52s
#111	Gemini 3.1 Flash Lite low	Google	10.0	6.5	$0.621	2/2	1.52s
Totaal tests 2 Foute tests 0 Totale kosten $0.621 Responstijd (gem.) 1.52s

Instructies opvolgen-ranglijst

Modellen filteren

Topmodellen op Instructies opvolgen-score

Instructies opvolgen-score vs totale kosten

Topmodellen op Responstijd (gem.)