Modelranglijst voor Programmeren

AI BENCHY Categorie

Zie welke AI-modellen het best presteren op Programmeren, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Correcte tests ↑.

Getoonde modellen

Gemiddelde Programmeren-score

5.7

Beste model

Qwen3.6 Flash 5.0

Foutredenen

Met foutreden Verkeerd antwoord230 Met foutreden API-fout43 Met foutreden Time-out25 Met foutreden Geen antwoord18 Met foutreden Instructies niet gevolgd16 Met foutreden Extra opmaak12

189/189

Rang	Model	Bedrijf	Programmeren-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#109	Gemini 2.5 Flash none	Google	5.5	6.2	$0.016	1/3	736ms
Totaal tests 3 Foute tests 2 Totale kosten $0.016 Responstijd (gem.) 736ms
#110	Gemini 3.1 Flash Lite minimal	Google	5.5	6.1	$0.013	1/3	831ms
Totaal tests 3 Foute tests 2 Totale kosten $0.013 Responstijd (gem.) 831ms
#112	Gemini 3.1 Flash Lite none	Google	5.5	6.1	$0.013	1/3	938ms
Totaal tests 3 Foute tests 2 Totale kosten $0.013 Responstijd (gem.) 938ms
#113	Qwen3.5-Flash none	Qwen	5.5	6.1	$0.005	1/3	850ms
Totaal tests 3 Foute tests 2 Totale kosten $0.005 Responstijd (gem.) 850ms
#114	Gemma 4 31B none	Google	5.5	6.1	$0.004	1/3	11.2s
Totaal tests 3 Foute tests 2 Totale kosten $0.004 Responstijd (gem.) 11.2s
#115	Nemotron 3 Ultra 550b A55b none	NVIDIA	5.5	6.1	$0.027	1/3	1.02s
Totaal tests 3 Foute tests 2 Totale kosten $0.027 Responstijd (gem.) 1.02s
#117	GPT-5.6 Terra none	OpenAI	5.5	6.0	$0.130	1/3	1.00s
Totaal tests 3 Foute tests 2 Totale kosten $0.130 Responstijd (gem.) 1.00s
#119	Qwen3.6 Flash none	Qwen	5.4	6.0	$0.015	1/3	1.79s
Totaal tests 3 Foute tests 2 Totale kosten $0.015 Responstijd (gem.) 1.79s
#120	Qwen3.5-35B-A3B none	Qwen	5.5	5.9	$0.012	1/3	1.39s
Totaal tests 3 Foute tests 2 Totale kosten $0.012 Responstijd (gem.) 1.39s
#121	Qwen3.5-27B none	Qwen	5.8	5.9	$0.015	1/3	1.80s
Totaal tests 3 Foute tests 2 Totale kosten $0.015 Responstijd (gem.) 1.80s
#122	GLM 5V Turbo none	Z.ai	5.5	5.9	$0.052	1/3	3.13s
Totaal tests 3 Foute tests 2 Totale kosten $0.052 Responstijd (gem.) 3.13s
#125	Owl Alpha medium	Openrouter	5.4	5.8	$0.000	1/3	18.7s
Totaal tests 3 Foute tests 2 Totale kosten $0.000 Responstijd (gem.) 18.7s
#126	Mimo V2 PRO none	Xiaomi	5.5	5.8	$0.045	1/3	2.65s
Totaal tests 3 Foute tests 2 Totale kosten $0.045 Responstijd (gem.) 2.65s
#127	Owl Alpha none	Openrouter	5.6	5.8	$0.000	1/3	36.9s
Totaal tests 3 Foute tests 2 Totale kosten $0.000 Responstijd (gem.) 36.9s
#128	Kimi K2.6 none	Moonshot AI	5.5	5.8	$0.078	1/3	82.6s
Totaal tests 3 Foute tests 2 Totale kosten $0.078 Responstijd (gem.) 82.6s

Programmeren-ranglijst

Modellen filteren

Topmodellen op Programmeren-score

Programmeren-score vs totale kosten

Topmodellen op Responstijd (gem.)