Modelranglijst voor Programmeren

AI BENCHY Categorie

Zie welke AI-modellen het best presteren op Programmeren, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Metriek ↑.

Getoonde modellen

Gemiddelde Programmeren-score

5.7

Beste model

Gemini 3.1 Flash Lite Preview 0.0

Foutredenen

Met foutreden Verkeerd antwoord230 Met foutreden API-fout43 Met foutreden Time-out25 Met foutreden Geen antwoord18 Met foutreden Instructies niet gevolgd16 Met foutreden Extra opmaak12

189/189

Rang	Model	Bedrijf	Programmeren-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#146	DeepSeek V3.2 none	DeepSeek	3.1	5.3	$0.016	0/3	14.5s
Totaal tests 3 Foute tests 3 Totale kosten $0.016 Responstijd (gem.) 14.5s
#101	Nemotron 3 Super medium	NVIDIA	3.1	6.3	$0.020	0/3	147.3s
Totaal tests 3 Foute tests 3 Totale kosten $0.020 Responstijd (gem.) 147.3s
#159	GPT-4o-mini none	OpenAI	3.2	5.0	$0.006	0/3	1.63s
Totaal tests 3 Foute tests 3 Totale kosten $0.006 Responstijd (gem.) 1.63s
#177	GLM 4.7 Flash medium	Z.ai	3.2	4.3	$0.054	0/3	55.3s
Totaal tests 3 Foute tests 3 Totale kosten $0.054 Responstijd (gem.) 55.3s
#87	Mimo V2 Omni medium	Xiaomi	3.3	6.8	$0.683	0/3	183.9s
Totaal tests 3 Foute tests 3 Totale kosten $0.683 Responstijd (gem.) 183.9s
#162	Nemotron 3 Super none	NVIDIA	3.3	4.9	$0.006	0/3	2.64s
Totaal tests 3 Foute tests 3 Totale kosten $0.006 Responstijd (gem.) 2.64s
#62	Claude Opus 4.7 none	Anthropic	3.3	7.4	$0.505	1/1	2.84s
Totaal tests 1 Foute tests 0 Totale kosten $0.505 Responstijd (gem.) 2.84s
#83	Grok 4.20 Beta medium	X AI	3.3	6.8	$0.750	1/1	31.4s
Totaal tests 1 Foute tests 0 Totale kosten $0.750 Responstijd (gem.) 31.4s
#97	Gemini 3.1 Flash Lite high	Google	3.3	6.5	$2.044	1/1	137.6s
Totaal tests 1 Foute tests 0 Totale kosten $2.044 Responstijd (gem.) 137.6s
#156	Grok 4.20 Multi Agent Beta medium	X AI	3.3	5.0	$5.599	1/1	27.1s
Totaal tests 1 Foute tests 0 Totale kosten $5.599 Responstijd (gem.) 27.1s
#180	Grok Build 0.1 none	X AI	3.3	4.2	$0.547	1/1	21.4s
Totaal tests 1 Foute tests 0 Totale kosten $0.547 Responstijd (gem.) 21.4s
#187	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.3	3.5	$0.000	1/1	1.27s
Totaal tests 1 Foute tests 0 Totale kosten $0.000 Responstijd (gem.) 1.27s
#171	Mercury 2 none	Inception	3.4	4.6	$0.011	0/3	1.03s
Totaal tests 3 Foute tests 3 Totale kosten $0.011 Responstijd (gem.) 1.03s
#166	MiniMax M2.5 medium	Minimax	3.4	4.7	$0.303	0/3	188.6s
Totaal tests 3 Foute tests 3 Totale kosten $0.303 Responstijd (gem.) 188.6s
#157	Trinity Large Preview none	Arcee AI	3.7	5.0	$0.008	0/3	14.3s
Totaal tests 3 Foute tests 3 Totale kosten $0.008 Responstijd (gem.) 14.3s

Programmeren-ranglijst

Modellen filteren

Topmodellen op Programmeren-score

Programmeren-score vs totale kosten

Topmodellen op Responstijd (gem.)