Modelranglijst voor Instructies opvolgen

Zie welke AI-modellen het best presteren op Instructies opvolgen, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Correcte tests ↓.

Getoonde modellen

Gemiddelde Instructies opvolgen-score

8.5

Beste model

Gemini 3 Flash Preview 10.0

Foutredenen

Met foutreden Verkeerd antwoord61 Met foutreden Instructies niet gevolgd18 Met foutreden Extra opmaak3 Met foutreden Geen antwoord2 Met foutreden API-fout1 Met foutreden Time-out1

210/210

Rang	Model	Bedrijf	Instructies opvolgen-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#17	Claude Fable 5 medium	Anthropic	10.0	8.6	$3.478	2/2	5.90s
Totaal tests 2 Foute tests 0 Totale kosten $3.478 Responstijd (gem.) 5.90s
#18	GPT-5.4 medium	OpenAI	10.0	8.5	$1.533	2/2	3.11s
Totaal tests 2 Foute tests 0 Totale kosten $1.533 Responstijd (gem.) 3.11s
#19	Qwen3.6 Max Preview medium	Qwen	10.0	8.4	$1.143	2/2	24.3s
Totaal tests 2 Foute tests 0 Totale kosten $1.143 Responstijd (gem.) 24.3s
#20	Grok 4.5 low	X AI	9.8	8.4	$0.935	2/2	2.80s
Totaal tests 2 Foute tests 0 Totale kosten $0.935 Responstijd (gem.) 2.80s
#21	GPT-5.2 medium	OpenAI	9.9	8.4	$0.951	2/2	3.12s
Totaal tests 2 Foute tests 0 Totale kosten $0.951 Responstijd (gem.) 3.12s
#22	Grok 4.5 medium	X AI	9.8	8.3	$1.928	2/2	6.06s
Totaal tests 2 Foute tests 0 Totale kosten $1.928 Responstijd (gem.) 6.06s
#23	Claude Sonnet 5 medium	Anthropic	9.9	8.3	$0.922	2/2	3.10s
Totaal tests 2 Foute tests 0 Totale kosten $0.922 Responstijd (gem.) 3.10s
#25	Gemini 2.5 Flash medium	Google	9.8	8.2	$0.643	2/2	2.62s
Totaal tests 2 Foute tests 0 Totale kosten $0.643 Responstijd (gem.) 2.62s
#26	GPT-5 Mini medium	OpenAI	10.0	8.1	$0.237	2/2	11.6s
Totaal tests 2 Foute tests 0 Totale kosten $0.237 Responstijd (gem.) 11.6s
#28	Inkling high	Thinkingmachines	9.8	8.0	$1.006	2/2	7.00s
Totaal tests 2 Foute tests 0 Totale kosten $1.006 Responstijd (gem.) 7.00s
#29	Step 3.7 Flash medium	Stepfun	9.8	8.0	$0.515	2/2	1.83s
Totaal tests 2 Foute tests 0 Totale kosten $0.515 Responstijd (gem.) 1.83s
#30	GPT-5.2 Chat none	OpenAI	9.8	8.0	$0.604	2/2	5.51s
Totaal tests 2 Foute tests 0 Totale kosten $0.604 Responstijd (gem.) 5.51s
#31	GLM 5.2 high	Z.ai	10.0	8.0	$0.970	2/2	4.26s
Totaal tests 2 Foute tests 0 Totale kosten $0.970 Responstijd (gem.) 4.26s
#32	Inkling medium	Thinkingmachines	9.8	8.0	$0.391	2/2	6.17s
Totaal tests 2 Foute tests 0 Totale kosten $0.391 Responstijd (gem.) 6.17s
#33	Kimi K3 max	Moonshot AI	10.0	8.0	$3.112	2/2	7.66s
Totaal tests 2 Foute tests 0 Totale kosten $3.112 Responstijd (gem.) 7.66s

Instructies opvolgen-ranglijst

Modellen filteren

Topmodellen op Instructies opvolgen-score

Instructies opvolgen-score vs totale kosten

Topmodellen op Responstijd (gem.)