Modell-Ranking für Programmierung

AI BENCHY Kategorie

Sieh, welche KI-Modelle bei Programmierung am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Antwortzeit (Durchschnitt) ↓.

Angezeigte Modelle

Durchschnittlicher Wert für Programmierung-Score

5.7

Bestes Modell

North Mini Code 4.5

Fehlergründe

Mit Fehlergrund Falsche Antwort230 Mit Fehlergrund API-Fehler43 Mit Fehlergrund Zeitüberschreitung25 Mit Fehlergrund Keine Antwort18 Mit Fehlergrund Anweisungen nicht befolgt16 Mit Fehlergrund Zusätzliche Formatierung12

189/189

Rang	Modell	Unternehmen	Programmierung-Score	Punktzahl	Gesamtkosten	Korrekte Tests	Antwortzeit (Durchschnitt)
#54	Grok Build 0.1 medium	X AI	5.7	7.6	$0.927	1/3	108.5s
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.927 Antwortzeit (Durchschnitt) 108.5s
#147	MiniMax M2.7 medium	Minimax	5.7	5.2	$0.100	1/3	101.9s
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.100 Antwortzeit (Durchschnitt) 101.9s
#185	Qwen3.5-9B medium	Qwen	2.9	3.8	$0.036	0/3	100.9s
Gesamttests 3 Falsche Tests 3 Gesamtkosten $0.036 Antwortzeit (Durchschnitt) 100.9s
#88	Hy3 preview high	Tencent	5.3	6.8	$0.048	1/3	99.8s
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.048 Antwortzeit (Durchschnitt) 99.8s
#90	MiMo-V2.5 medium	Xiaomi	6.2	6.7	$0.061	1/3	97.1s
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.061 Antwortzeit (Durchschnitt) 97.1s
#91	Mimo V2 PRO medium	Xiaomi	6.0	6.7	$0.333	1/3	94.2s
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.333 Antwortzeit (Durchschnitt) 94.2s
#64	MiMo-V2.5-Pro medium	Xiaomi	6.2	7.4	$0.106	1/3	92.1s
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.106 Antwortzeit (Durchschnitt) 92.1s
#2	Gemini 3 Flash Preview medium	Google	8.6	9.6	$0.667	2/3	84.4s
Gesamttests 3 Falsche Tests 1 Gesamtkosten $0.667 Antwortzeit (Durchschnitt) 84.4s
#128	Kimi K2.6 none	Moonshot AI	5.5	5.8	$0.078	1/3	82.6s
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.078 Antwortzeit (Durchschnitt) 82.6s
#160	Cobuddy medium	Baidu	3.7	4.9	$0.000	0/3	79.2s
Gesamttests 3 Falsche Tests 3 Gesamtkosten $0.000 Antwortzeit (Durchschnitt) 79.2s
#18	GLM 5 medium	Z.ai	10.0	8.6	$0.228	3/3	74.3s
Gesamttests 3 Falsche Tests 0 Gesamtkosten $0.228 Antwortzeit (Durchschnitt) 74.3s
#32	GLM 5.2 high	Z.ai	6.4	8.0	$0.554	1/3	73.0s
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.554 Antwortzeit (Durchschnitt) 73.0s
#78	Laguna XS 2.1 medium	Poolside	5.5	7.0	$0.036	1/3	70.3s
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.036 Antwortzeit (Durchschnitt) 70.3s
#69	GLM 5V Turbo medium	Z.ai	6.0	7.3	$0.457	1/3	63.4s
Gesamttests 3 Falsche Tests 2 Gesamtkosten $0.457 Antwortzeit (Durchschnitt) 63.4s
#12	GPT-5.5 medium	OpenAI	8.8	9.0	$3.679	2/3	59.8s
Gesamttests 3 Falsche Tests 1 Gesamtkosten $3.679 Antwortzeit (Durchschnitt) 59.8s

Programmierung-Ranking

Modelle filtern

Top-Modelle nach Programmierung-Score

Programmierung-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)