AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Kategorie

Programmierung-Ranking

Sieh, welche KI-Modelle bei Programmierung am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Korrekte Tests ↓.

Angezeigte Modelle

15

Durchschnittlicher Wert für Programmierung-Score

7.2

Rang Modell Unternehmen Programmierung-Score Punktzahl Korrekte Tests Antwortzeit (Durchschnitt)
#51 Mercury 2 medium Inception 10.0 6.5 1/1 1.53s
#53 Grok 4.20 Multi Agent Beta medium X AI 10.0 6.4 1/1 27.1s
#55 GLM 5V Turbo none Z.ai 10.0 6.2 1/1 5.30s
#56 Qwen3.5-Flash none Qwen 10.0 6.2 1/1 1.29s
#58 Seed-2.0-Lite none Bytedance Seed 10.0 6.2 1/1 4.61s
#59 Gemini 2.5 Flash none Google 10.0 6.2 1/1 1.16s
#60 Qwen3.5-35B-A3B none Qwen 10.0 6.1 1/1 2.67s
#62 MiMo-V2-Pro none Xiaomi 10.0 6.0 1/1 3.82s
#63 GPT-5.4 none OpenAI 10.0 5.9 1/1 2.95s
#64 Qwen3.5-27B none Qwen 10.0 5.9 1/1 2.51s
#72 Kimi K2.5 none Moonshot AI 10.0 5.5 1/1 38.8s
#76 MiniMax M2.7 medium Minimax 10.0 5.3 1/1 91.3s
#80 GPT-5.4 Mini none OpenAI 10.0 5.1 1/1 1.19s
#10 Gemini 3 PRO Preview medium Google 3.0 8.4 0/1 0ms
#12 Gemma 4 31B medium Google 4.7 8.3 0/1 71.0s

Top-Modelle nach Programmierung-Score

Programmierung-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)