AI BENCHY
Your ad here

AI BENCHY Categorie

Programmeren-ranglijst

Zie welke AI-modellen het best presteren op Programmeren, welke betrouwbaar blijven en waar de grootste verschillen zitten.

Getoonde modellen

15

Gemiddelde Programmeren-score

7.2

Rang Model Bedrijf Programmeren-score Score Correcte tests Responstijd (gem.)
#51 Mercury 2 medium Inception 10.0 6.5 1/1 1.53s
#53 Grok 4.20 Multi Agent Beta medium X AI 10.0 6.4 1/1 27.1s
#55 GLM 5V Turbo none Z.ai 10.0 6.2 1/1 5.30s
#56 Qwen3.5-Flash none Qwen 10.0 6.2 1/1 1.29s
#58 Seed-2.0-Lite none Bytedance Seed 10.0 6.2 1/1 4.61s
#59 Gemini 2.5 Flash none Google 10.0 6.2 1/1 1.16s
#60 Qwen3.5-35B-A3B none Qwen 10.0 6.1 1/1 2.67s
#62 MiMo-V2-Pro none Xiaomi 10.0 6.0 1/1 3.82s
#63 GPT-5.4 none OpenAI 10.0 5.9 1/1 2.95s
#64 Qwen3.5-27B none Qwen 10.0 5.9 1/1 2.51s
#72 Kimi K2.5 none Moonshot AI 10.0 5.5 1/1 38.8s
#76 MiniMax M2.7 medium Minimax 10.0 5.3 1/1 91.3s
#80 GPT-5.4 Mini none OpenAI 10.0 5.1 1/1 1.19s
#81 Qwen3 Coder Next none Qwen 7.3 5.1 0/1 3.14s
#90 GPT-5.4 Nano none OpenAI 7.1 4.5 0/1 1.43s

Topmodellen op Programmeren-score

Programmeren-score vs totale kosten

Topmodellen op Responstijd (gem.)