Modelranglijst voor Domeinspecifiek

Zie welke AI-modellen het best presteren op Domeinspecifiek, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Correcte tests ↓.

Getoonde modellen

Gemiddelde Domeinspecifiek-score

4.7

Beste model

Gemini 3 Flash Preview 10.0

Foutredenen

Met foutreden Verkeerd antwoord412 Met foutreden Time-out43 Met foutreden Extra opmaak17 Met foutreden Geen antwoord8 Met foutreden API-fout7 Met foutreden Instructies niet gevolgd1

210/210

Rang	Model	Bedrijf	Domeinspecifiek-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#1	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.742	3/3	15.3s
Totaal tests 3 Foute tests 0 Totale kosten $0.742 Responstijd (gem.) 15.3s
#88	Gemini 3.5 Flash minimal	Google	10.0	6.8	$0.300	3/3	899ms
Totaal tests 3 Foute tests 0 Totale kosten $0.300 Responstijd (gem.) 899ms
#209	Step 3.5 Flash none	Stepfun	3.3	2.3	$0.020	1/1	34.5s
Totaal tests 1 Foute tests 0 Totale kosten $0.020 Responstijd (gem.) 34.5s
#2	Gemini 3.5 Flash high	Google	7.6	9.5	$1.976	2/3	14.1s
Totaal tests 3 Foute tests 1 Totale kosten $1.976 Responstijd (gem.) 14.1s
#7	Gemini 3.1 Pro Preview medium	Google	7.7	9.2	$1.361	2/3	32.7s
Totaal tests 3 Foute tests 1 Totale kosten $1.361 Responstijd (gem.) 32.7s
#9	Gemini 3.5 Flash medium	Google	7.7	9.1	$0.642	2/3	5.24s
Totaal tests 3 Foute tests 1 Totale kosten $0.642 Responstijd (gem.) 5.24s
#11	Gemini 3.5 Flash low	Google	7.7	8.9	$0.433	2/3	3.39s
Totaal tests 3 Foute tests 1 Totale kosten $0.433 Responstijd (gem.) 3.39s
#15	Claude Opus 4.7 medium	Anthropic	7.7	8.7	$1.477	2/3	1.17s
Totaal tests 3 Foute tests 1 Totale kosten $1.477 Responstijd (gem.) 1.17s
#23	Claude Sonnet 5 medium	Anthropic	7.7	8.3	$0.922	2/3	20.4s
Totaal tests 3 Foute tests 1 Totale kosten $0.922 Responstijd (gem.) 20.4s
#28	Inkling high	Thinkingmachines	7.7	8.0	$1.006	2/3	186.4s
Totaal tests 3 Foute tests 1 Totale kosten $1.006 Responstijd (gem.) 186.4s
#29	Step 3.7 Flash medium	Stepfun	7.7	8.0	$0.515	2/3	48.3s
Totaal tests 3 Foute tests 1 Totale kosten $0.515 Responstijd (gem.) 48.3s
#44	GPT-5.6 Luna high	OpenAI	7.7	7.7	$1.017	2/3	79.0s
Totaal tests 3 Foute tests 1 Totale kosten $1.017 Responstijd (gem.) 79.0s
#59	Qwen3.7 Max none	Qwen	7.7	7.4	$0.197	2/3	975ms
Totaal tests 3 Foute tests 1 Totale kosten $0.197 Responstijd (gem.) 975ms
#63	Claude Sonnet 4.6 none	Anthropic	7.7	7.3	$0.661	2/3	3.54s
Totaal tests 3 Foute tests 1 Totale kosten $0.661 Responstijd (gem.) 3.54s
#79	Gemini 3.5 Flash none	Google	7.6	7.0	$1.079	2/3	10.6s
Totaal tests 3 Foute tests 1 Totale kosten $1.079 Responstijd (gem.) 10.6s

Domeinspecifiek-ranglijst

Modellen filteren

Topmodellen op Domeinspecifiek-score

Domeinspecifiek-score vs totale kosten

Topmodellen op Responstijd (gem.)