Modelranglijst voor Instructies opvolgen

Zie welke AI-modellen het best presteren op Instructies opvolgen, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Responstijd (gem.) ↑.

Getoonde modellen

Gemiddelde Instructies opvolgen-score

8.6

Beste model

Granite 4.1 8B 3.6

Foutredenen

Met foutreden Verkeerd antwoord61 Met foutreden Instructies niet gevolgd19 Met foutreden Extra opmaak3 Met foutreden Geen antwoord2 Met foutreden API-fout1 Met foutreden Time-out1

216/216

Rang	Model	Bedrijf	Instructies opvolgen-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#47	Claude Opus 4.6 medium	Anthropic	10.0	7.7	$3.059	2/2	2.43s
Totaal tests 2 Foute tests 0 Totale kosten $3.059 Responstijd (gem.) 2.43s
#7	GPT-5.6 Sol medium	OpenAI	10.0	9.4	$1.316	2/2	2.50s
Totaal tests 2 Foute tests 0 Totale kosten $1.316 Responstijd (gem.) 2.50s
#153	Mimo V2 PRO none	Xiaomi	6.5	5.6	$0.045	1/2	2.51s
Totaal tests 2 Foute tests 1 Totale kosten $0.045 Responstijd (gem.) 2.51s
#66	KAT-Coder-Pro V2.5 low	Kwaipilot	10.0	7.4	$0.387	2/2	2.53s
Totaal tests 2 Foute tests 0 Totale kosten $0.387 Responstijd (gem.) 2.53s
#108	Laguna XS 2.1 medium	Poolside	9.8	6.5	$0.068	2/2	2.57s
Totaal tests 2 Foute tests 0 Totale kosten $0.068 Responstijd (gem.) 2.57s
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	9.9	6.9	$0.467	2/2	2.58s
Totaal tests 2 Foute tests 0 Totale kosten $0.467 Responstijd (gem.) 2.58s
#118	Claude Sonnet 5 none	Anthropic	6.4	6.3	$0.548	1/2	2.58s
Totaal tests 2 Foute tests 1 Totale kosten $0.548 Responstijd (gem.) 2.58s
#69	Gemini 3.1 Flash Lite medium	Google	9.9	7.3	$0.117	2/2	2.59s
Totaal tests 2 Foute tests 0 Totale kosten $0.117 Responstijd (gem.) 2.59s
#44	Claude Sonnet 4.6 medium	Anthropic	10.0	7.8	$2.057	2/2	2.61s
Totaal tests 2 Foute tests 0 Totale kosten $2.057 Responstijd (gem.) 2.61s
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	9.8	6.7	$0.476	2/2	2.61s
Totaal tests 2 Foute tests 0 Totale kosten $0.476 Responstijd (gem.) 2.61s
#28	Gemini 2.5 Flash medium	Google	9.8	8.2	$0.643	2/2	2.62s
Totaal tests 2 Foute tests 0 Totale kosten $0.643 Responstijd (gem.) 2.62s
#154	Owl Alpha none	Openrouter	6.4	5.6	$0.000	1/2	2.63s
Totaal tests 2 Foute tests 1 Totale kosten $0.000 Responstijd (gem.) 2.63s
#73	KAT-Coder-Pro V2.5 high	Kwaipilot	9.9	7.2	$0.482	2/2	2.67s
Totaal tests 2 Foute tests 0 Totale kosten $0.482 Responstijd (gem.) 2.67s
#161	Kimi K2.5 none	Moonshot AI	6.5	5.5	$0.127	1/2	2.67s
Totaal tests 2 Foute tests 1 Totale kosten $0.127 Responstijd (gem.) 2.67s
#12	Gemini 3.5 Flash medium	Google	9.9	9.1	$0.642	2/2	2.70s
Totaal tests 2 Foute tests 0 Totale kosten $0.642 Responstijd (gem.) 2.70s

Instructies opvolgen-ranglijst

Modellen filteren

Topmodellen op Instructies opvolgen-score

Instructies opvolgen-score vs totale kosten

Topmodellen op Responstijd (gem.)