Ranglijst voor Domeinspecifiek x Verkeerd antwoord

Zie welke AI-modellen op Domeinspecifiek het meest kans hebben op Verkeerd antwoord, zodat je zwakke punten sneller ziet.

Getoonde modellen

Totaal fouten

421

Meest getroffen model

Muse Spark 1.1 3

Foutredenen

Verkeerd antwoord421 Time-out43 Extra opmaak17 Geen antwoord8 API-fout7 Instructies niet gevolgd1

Categorieën

Domeinspecifiek421 Anti-AI-trucs293 Programmeren259 Puzzeloplossing204 Algemene kennis172 Gecombineerd69 Algemene intelligentie62 Instructies opvolgen61 Gegevensparsering en extractie41 Toolaanroepen3

202/202

Rang	Model	Bedrijf	Verkeerd antwoord-aantal	Categoriescore	Totale kosten	Correcte tests	Responstijd (gem.)
#214	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3	3.6	$0.000	0/3	489ms
Totaal tests 3 Foute tests 3 Totale kosten $0.000 Responstijd (gem.) 489ms
#5	GPT-5.6 Sol low	OpenAI	2	5.3	$0.971	1/3	29.1s
Totaal tests 3 Foute tests 2 Totale kosten $0.971 Responstijd (gem.) 29.1s
#7	GPT-5.6 Sol medium	OpenAI	2	5.9	$1.316	1/3	47.9s
Totaal tests 3 Foute tests 2 Totale kosten $1.316 Responstijd (gem.) 47.9s
#8	GPT-5.6 Sol high	OpenAI	2	5.3	$1.234	1/3	39.5s
Totaal tests 3 Foute tests 2 Totale kosten $1.234 Responstijd (gem.) 39.5s
#9	GPT-5.5 low	OpenAI	2	5.3	$1.253	1/3	28.1s
Totaal tests 3 Foute tests 2 Totale kosten $1.253 Responstijd (gem.) 28.1s
#11	Qwen3.7 Max medium	Qwen	2	5.9	$1.116	1/3	24.9s
Totaal tests 3 Foute tests 2 Totale kosten $1.116 Responstijd (gem.) 24.9s
#13	GPT-5.5 medium	OpenAI	2	5.3	$4.137	1/3	164.1s
Totaal tests 3 Foute tests 2 Totale kosten $4.137 Responstijd (gem.) 164.1s
#15	Grok 4.5 high	X AI	2	3.6	$1.707	0/3	332.1s
Totaal tests 3 Foute tests 3 Totale kosten $1.707 Responstijd (gem.) 332.1s
#16	GPT-5.3-Codex medium	OpenAI	2	5.9	$0.920	1/3	64.3s
Totaal tests 3 Foute tests 2 Totale kosten $0.920 Responstijd (gem.) 64.3s
#17	Claude Opus 4.8 medium	Anthropic	2	5.3	$1.931	1/3	14.6s
Totaal tests 3 Foute tests 2 Totale kosten $1.931 Responstijd (gem.) 14.6s
#20	Claude Fable 5 medium	Anthropic	2	5.3	$3.478	1/3	53.4s
Totaal tests 3 Foute tests 2 Totale kosten $3.478 Responstijd (gem.) 53.4s
#21	GPT-5.4 medium	OpenAI	2	5.3	$1.533	1/3	74.3s
Totaal tests 3 Foute tests 2 Totale kosten $1.533 Responstijd (gem.) 74.3s
#28	Gemini 2.5 Flash medium	Google	2	5.9	$0.643	1/3	37.3s
Totaal tests 3 Foute tests 2 Totale kosten $0.643 Responstijd (gem.) 37.3s
#29	GPT-5 Mini medium	OpenAI	2	3.6	$0.237	0/3	44.6s
Totaal tests 3 Foute tests 3 Totale kosten $0.237 Responstijd (gem.) 44.6s
#30	Muse Spark 1.1 high	Meta	2	3.5	$1.694	0/3	67.4s
Totaal tests 3 Foute tests 3 Totale kosten $1.694 Responstijd (gem.) 67.4s

Modellen filteren

Topmodellen op Verkeerd antwoord-aantal

Verkeerd antwoord-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten

Domeinspecifiek: Verkeerd antwoord

Modellen filteren

Topmodellen op Verkeerd antwoord-aantal

Verkeerd antwoord-aantal vs Score

Topmodellen op Responstijd (gem.)

Topmodellen op Geschatte verspilde kosten