Modelranglijst voor Programmeren

AI BENCHY Categorie

Zie welke AI-modellen het best presteren op Programmeren, welke betrouwbaar blijven en waar de grootste verschillen zitten. Sorteren op: Correcte tests ↑.

Getoonde modellen

Gemiddelde Programmeren-score

5.7

Beste model

Qwen3.6 Flash 5.0

Foutredenen

Met foutreden Verkeerd antwoord230 Met foutreden API-fout43 Met foutreden Time-out25 Met foutreden Geen antwoord18 Met foutreden Instructies niet gevolgd16 Met foutreden Extra opmaak12

189/189

Rang	Model	Bedrijf	Programmeren-score	Score	Totale kosten	Correcte tests	Responstijd (gem.)
#129	GPT-5.4 none	OpenAI	5.5	5.8	$0.122	1/3	1.62s
Totaal tests 3 Foute tests 2 Totale kosten $0.122 Responstijd (gem.) 1.62s
#136	Kimi K2.5 none	Moonshot AI	5.5	5.5	$0.027	1/3	24.6s
Totaal tests 3 Foute tests 2 Totale kosten $0.027 Responstijd (gem.) 24.6s
#138	Qwen3.6 27B none	Qwen	5.5	5.5	$0.025	1/3	4.16s
Totaal tests 3 Foute tests 2 Totale kosten $0.025 Responstijd (gem.) 4.16s
#144	GPT-5.4 Mini none	OpenAI	5.5	5.3	$0.038	1/3	913ms
Totaal tests 3 Foute tests 2 Totale kosten $0.038 Responstijd (gem.) 913ms
#147	MiniMax M2.7 medium	Minimax	5.7	5.2	$0.100	1/3	101.9s
Totaal tests 3 Foute tests 2 Totale kosten $0.100 Responstijd (gem.) 101.9s
#148	Qwen3.6 35B A3B none	Qwen	5.5	5.2	$0.031	1/3	8.77s
Totaal tests 3 Foute tests 2 Totale kosten $0.031 Responstijd (gem.) 8.77s
#154	MiMo-V2.5 none	Xiaomi	5.5	5.1	$0.006	1/3	3.24s
Totaal tests 3 Foute tests 2 Totale kosten $0.006 Responstijd (gem.) 3.24s
#163	Ling-2.6-flash none	Inclusionai	5.3	4.9	$0.001	1/3	11.2s
Totaal tests 3 Foute tests 2 Totale kosten $0.001 Responstijd (gem.) 11.2s
#164	Ring-2.6-1T none	Inclusionai	5.3	4.8	$0.026	1/3	143.8s
Totaal tests 3 Foute tests 2 Totale kosten $0.026 Responstijd (gem.) 143.8s
#2	Gemini 3 Flash Preview medium	Google	8.6	9.6	$0.667	2/3	84.4s
Totaal tests 3 Foute tests 1 Totale kosten $0.667 Responstijd (gem.) 84.4s
#8	Gemini 3.5 Flash low	Google	7.8	9.2	$0.349	2/3	6.71s
Totaal tests 3 Foute tests 1 Totale kosten $0.349 Responstijd (gem.) 6.71s
#10	Gemini 3.1 Pro Preview medium	Google	7.9	9.2	$1.054	2/3	40.2s
Totaal tests 3 Foute tests 1 Totale kosten $1.054 Responstijd (gem.) 40.2s
#11	Gemini 3.5 Flash medium	Google	7.9	9.1	$0.582	2/3	12.6s
Totaal tests 3 Foute tests 1 Totale kosten $0.582 Responstijd (gem.) 12.6s
#12	GPT-5.5 medium	OpenAI	8.8	9.0	$3.679	2/3	59.8s
Totaal tests 3 Foute tests 1 Totale kosten $3.679 Responstijd (gem.) 59.8s
#14	Qwen3.6 Max Preview medium	Qwen	8.8	8.9	$0.960	2/3	146.5s
Totaal tests 3 Foute tests 1 Totale kosten $0.960 Responstijd (gem.) 146.5s

←

1 9 10 11 13

→

Programmeren-ranglijst

Modellen filteren

Topmodellen op Programmeren-score

Programmeren-score vs totale kosten

Topmodellen op Responstijd (gem.)