Modelranglijst voor Domeinspecifiek

Zie welke AI-modellen het best presteren op Domeinspecifiek, welke betrouwbaar blijven en waar de grootste verschillen zitten.

Getoonde modellen

Gemiddelde Domeinspecifiek-score

4.7

Beste model

Gemini 3 Flash Preview 10.0

Foutredenen

Met foutreden Verkeerd antwoord404 Met foutreden Time-out39 Met foutreden Extra opmaak17 Met foutreden Geen antwoord8 Met foutreden API-fout7 Met foutreden Instructies niet gevolgd1

206/206

Rang	Model	Bedrijf	Domeinspecifiek-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#1	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.742	3/3	15.3s
Totaal tests 3 Foute tests 0 Totale kosten $0.742 Responstijd (gem.) 15.3s
#87	Gemini 3.5 Flash minimal	Google	10.0	6.8	$0.300	3/3	899ms
Totaal tests 3 Foute tests 0 Totale kosten $0.300 Responstijd (gem.) 899ms
#7	Gemini 3.1 Pro Preview medium	Google	7.7	9.2	$1.361	2/3	32.7s
Totaal tests 3 Foute tests 1 Totale kosten $1.361 Responstijd (gem.) 32.7s
#9	Gemini 3.5 Flash medium	Google	7.7	9.1	$0.642	2/3	5.24s
Totaal tests 3 Foute tests 1 Totale kosten $0.642 Responstijd (gem.) 5.24s
#11	Gemini 3.5 Flash low	Google	7.7	8.9	$0.433	2/3	3.39s
Totaal tests 3 Foute tests 1 Totale kosten $0.433 Responstijd (gem.) 3.39s
#15	Claude Opus 4.7 medium	Anthropic	7.7	8.7	$1.477	2/3	1.17s
Totaal tests 3 Foute tests 1 Totale kosten $1.477 Responstijd (gem.) 1.17s
#23	Claude Sonnet 5 medium	Anthropic	7.7	8.3	$0.922	2/3	20.4s
Totaal tests 3 Foute tests 1 Totale kosten $0.922 Responstijd (gem.) 20.4s
#28	Inkling high	Thinkingmachines	7.7	8.0	$1.006	2/3	186.4s
Totaal tests 3 Foute tests 1 Totale kosten $1.006 Responstijd (gem.) 186.4s
#29	Step 3.7 Flash medium	Stepfun	7.7	8.0	$0.515	2/3	48.3s
Totaal tests 3 Foute tests 1 Totale kosten $0.515 Responstijd (gem.) 48.3s
#44	GPT-5.6 Luna high	OpenAI	7.7	7.7	$1.017	2/3	79.0s
Totaal tests 3 Foute tests 1 Totale kosten $1.017 Responstijd (gem.) 79.0s
#59	Qwen3.7 Max none	Qwen	7.7	7.4	$0.197	2/3	975ms
Totaal tests 3 Foute tests 1 Totale kosten $0.197 Responstijd (gem.) 975ms
#62	Claude Sonnet 4.6 none	Anthropic	7.7	7.3	$0.661	2/3	3.54s
Totaal tests 3 Foute tests 1 Totale kosten $0.661 Responstijd (gem.) 3.54s
#88	Gemini 3 Flash Preview none	Google	7.7	6.8	$0.085	2/3	963ms
Totaal tests 3 Foute tests 1 Totale kosten $0.085 Responstijd (gem.) 963ms
#92	Claude Opus 4.7 none	Anthropic	7.7	6.6	$0.505	2/3	1.19s
Totaal tests 3 Foute tests 1 Totale kosten $0.505 Responstijd (gem.) 1.19s
#95	Qwen3.6 Max Preview none	Qwen	7.7	6.6	$0.231	2/3	1.22s
Totaal tests 3 Foute tests 1 Totale kosten $0.231 Responstijd (gem.) 1.22s

Domeinspecifiek-ranglijst

Modellen filteren

Topmodellen op Domeinspecifiek-score

Domeinspecifiek-score vs totale kosten

Topmodellen op Responstijd (gem.)