Modelranglijst voor Programmeren

AI BENCHY Categorie

Zie welke AI-modellen het best presteren op Programmeren, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Responstijd (gem.) ↑.

Getoonde modellen

Gemiddelde Programmeren-score

5.7

Beste model

Gemini 3 PRO Preview 3.0

Foutredenen

Met foutreden Verkeerd antwoord230 Met foutreden API-fout43 Met foutreden Time-out23 Met foutreden Geen antwoord18 Met foutreden Instructies niet gevolgd16 Met foutreden Extra opmaak12

188/188

Rang	Model	Bedrijf	Programmeren-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#111	Gemini 3.1 Flash Lite none	Google	5.5	6.1	$0.013	1/3	938ms
Totaal tests 3 Foute tests 2 Totale kosten $0.013 Responstijd (gem.) 938ms
#97	Gemini 3.1 Flash Lite Preview none	Google	5.5	6.4	$0.018	1/3	967ms
Totaal tests 3 Foute tests 2 Totale kosten $0.018 Responstijd (gem.) 967ms
#142	GPT-5.6 Luna none	OpenAI	3.8	5.3	$0.047	0/3	980ms
Totaal tests 3 Foute tests 3 Totale kosten $0.047 Responstijd (gem.) 980ms
#116	GPT-5.6 Terra none	OpenAI	5.5	6.0	$0.130	1/3	1.00s
Totaal tests 3 Foute tests 2 Totale kosten $0.130 Responstijd (gem.) 1.00s
#114	Nemotron 3 Ultra 550b A55b none	NVIDIA	5.5	6.1	$0.027	1/3	1.02s
Totaal tests 3 Foute tests 2 Totale kosten $0.027 Responstijd (gem.) 1.02s
#170	Mercury 2 none	Inception	3.4	4.6	$0.011	0/3	1.03s
Totaal tests 3 Foute tests 3 Totale kosten $0.011 Responstijd (gem.) 1.03s
#168	Grok 4.20 Beta none	X AI	1.8	4.7	$0.087	0/1	1.14s
Totaal tests 1 Foute tests 1 Totale kosten $0.087 Responstijd (gem.) 1.14s
#174	Grok 4.20 none	X AI	1.1	4.4	$0.057	0/1	1.22s
Totaal tests 1 Foute tests 1 Totale kosten $0.057 Responstijd (gem.) 1.22s
#186	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.3	3.5	$0.000	1/1	1.27s
Totaal tests 1 Foute tests 0 Totale kosten $0.000 Responstijd (gem.) 1.27s
#172	Elephant Alpha medium	Openrouter	3.7	4.5	$0.000	0/3	1.30s
Totaal tests 3 Foute tests 3 Totale kosten $0.000 Responstijd (gem.) 1.30s
#81	Qwen3.7 Max none	Qwen	5.5	6.9	$0.054	1/3	1.35s
Totaal tests 3 Foute tests 2 Totale kosten $0.054 Responstijd (gem.) 1.35s
#104	GPT-5.5 none	OpenAI	5.5	6.3	$0.231	1/3	1.35s
Totaal tests 3 Foute tests 2 Totale kosten $0.231 Responstijd (gem.) 1.35s
#101	GPT-5.6 Sol none	OpenAI	5.5	6.3	$0.225	1/3	1.39s
Totaal tests 3 Foute tests 2 Totale kosten $0.225 Responstijd (gem.) 1.39s
#95	Gemini 3.1 Flash Lite Preview low	Google	5.5	6.5	$0.026	1/3	1.39s
Totaal tests 3 Foute tests 2 Totale kosten $0.026 Responstijd (gem.) 1.39s
#171	Elephant Alpha none	Openrouter	4.2	4.6	$0.000	0/3	1.39s
Totaal tests 3 Foute tests 3 Totale kosten $0.000 Responstijd (gem.) 1.39s

Programmeren-ranglijst

Modellen filteren

Topmodellen op Programmeren-score

Programmeren-score vs totale kosten

Topmodellen op Responstijd (gem.)