Modelranglijst voor Instructies opvolgen

Zie welke AI-modellen het best presteren op Instructies opvolgen, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Responstijd (gem.) ↓.

Getoonde modellen

Gemiddelde Instructies opvolgen-score

8.6

Beste model

Kimi K2.5 10.0

Foutredenen

Met foutreden Verkeerd antwoord61 Met foutreden Instructies niet gevolgd19 Met foutreden Extra opmaak3 Met foutreden Geen antwoord2 Met foutreden API-fout1 Met foutreden Time-out1

216/216

Rang	Model	Bedrijf	Instructies opvolgen-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	9.9	6.9	$0.467	2/2	2.58s
Totaal tests 2 Foute tests 0 Totale kosten $0.467 Responstijd (gem.) 2.58s
#108	Laguna XS 2.1 medium	Poolside	9.8	6.5	$0.068	2/2	2.57s
Totaal tests 2 Foute tests 0 Totale kosten $0.068 Responstijd (gem.) 2.57s
#66	KAT-Coder-Pro V2.5 low	Kwaipilot	10.0	7.4	$0.387	2/2	2.53s
Totaal tests 2 Foute tests 0 Totale kosten $0.387 Responstijd (gem.) 2.53s
#153	Mimo V2 PRO none	Xiaomi	6.5	5.6	$0.045	1/2	2.51s
Totaal tests 2 Foute tests 1 Totale kosten $0.045 Responstijd (gem.) 2.51s
#7	GPT-5.6 Sol medium	OpenAI	10.0	9.4	$1.316	2/2	2.50s
Totaal tests 2 Foute tests 0 Totale kosten $1.316 Responstijd (gem.) 2.50s
#47	Claude Opus 4.6 medium	Anthropic	10.0	7.7	$3.059	2/2	2.43s
Totaal tests 2 Foute tests 0 Totale kosten $3.059 Responstijd (gem.) 2.43s
#54	GPT-5.6 Luna medium	OpenAI	9.9	7.6	$0.352	2/2	2.38s
Totaal tests 2 Foute tests 0 Totale kosten $0.352 Responstijd (gem.) 2.38s
#5	GPT-5.6 Sol low	OpenAI	10.0	9.5	$0.971	2/2	2.27s
Totaal tests 2 Foute tests 0 Totale kosten $0.971 Responstijd (gem.) 2.27s
#38	GPT-5.6 Terra high	OpenAI	10.0	8.0	$1.055	2/2	2.14s
Totaal tests 2 Foute tests 0 Totale kosten $1.055 Responstijd (gem.) 2.14s
#176	GLM 5 Turbo none	Z.ai	6.5	5.1	$0.047	1/2	2.13s
Totaal tests 2 Foute tests 1 Totale kosten $0.047 Responstijd (gem.) 2.13s
#60	GPT-5.4 Mini medium	OpenAI	9.8	7.5	$0.756	2/2	2.13s
Totaal tests 2 Foute tests 0 Totale kosten $0.756 Responstijd (gem.) 2.13s
#6	Gemini 3.6 Flash low	Google	10.0	9.4	$0.517	2/2	2.05s
Totaal tests 2 Foute tests 0 Totale kosten $0.517 Responstijd (gem.) 2.05s
#123	GPT-5.6 Luna low	OpenAI	8.5	6.2	$0.249	1/2	2.04s
Totaal tests 2 Foute tests 1 Totale kosten $0.249 Responstijd (gem.) 2.04s
#157	GLM 5.1 none	Z.ai	9.8	5.5	$0.164	2/2	1.98s
Totaal tests 2 Foute tests 0 Totale kosten $0.164 Responstijd (gem.) 1.98s
#151	GLM 5V Turbo none	Z.ai	6.5	5.6	$0.052	1/2	1.97s
Totaal tests 2 Foute tests 1 Totale kosten $0.052 Responstijd (gem.) 1.97s

Instructies opvolgen-ranglijst

Modellen filteren

Topmodellen op Instructies opvolgen-score

Instructies opvolgen-score vs totale kosten

Topmodellen op Responstijd (gem.)