AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Kategorie

Kombiniert-Ranking

Sieh, welche KI-Modelle bei Kombiniert am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Korrekte Tests ↓.

Angezeigte Modelle

15

Durchschnittlicher Wert für Kombiniert-Score

6.2

Rang Modell Unternehmen Kombiniert-Score Punktzahl Korrekte Tests Antwortzeit (Durchschnitt)
#39 Seed-2.0-Mini medium Bytedance Seed 10.0 7.5 1/1 262.8s
#40 GPT-5.2 medium OpenAI 10.0 7.5 1/1 14.1s
#41 MiMo-V2-Flash medium Xiaomi 9.8 7.5 1/1 75.7s
#42 Claude Sonnet 4.6 none Anthropic 9.5 7.4 1/1 23.8s
#44 GPT-5.4 Mini medium OpenAI 10.0 7.3 1/1 17.8s
#45 GPT-5 Mini medium OpenAI 10.0 7.0 1/1 88.2s
#46 Kimi K2.5 medium Moonshot AI 10.0 7.0 1/1 71.4s
#47 Grok 4.20 medium X AI 10.0 7.0 1/1 17.4s
#51 Nemotron 3 Super medium NVIDIA 10.0 6.7 1/1 87.8s
#52 Grok 4.1 Fast medium X AI 10.0 6.7 1/1 37.6s
#54 Mercury 2 medium Inception 10.0 6.5 1/1 3.28s
#57 GPT-5 Nano medium OpenAI 10.0 6.3 1/1 66.0s
#68 gpt-oss-120b medium OpenAI 10.0 5.8 1/1 31.2s
#5 Gemini 3 Flash Preview low Google 3.0 8.8 0/1 3.27s
#12 Gemini 3 PRO Preview medium Google 3.0 8.4 0/1 10.4s

Top-Modelle nach Kombiniert-Score

Kombiniert-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)