AI BENCHY
Your ad here

AI BENCHY Kategorie

Befolgung von Anweisungen-Ranking

Sieh, welche KI-Modelle bei Befolgung von Anweisungen am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Korrekte Tests ↓.

Angezeigte Modelle

15

Durchschnittlicher Wert für Befolgung von Anweisungen-Score

8.0

Rang Modell Unternehmen Befolgung von Anweisungen-Score Punktzahl Korrekte Tests Antwortzeit (Durchschnitt)
#56 Grok 4.20 Multi Agent Beta medium X AI 8.3 6.4 1/2 4.63s
#57 GPT-5 Nano medium OpenAI 8.5 6.3 1/2 11.9s
#58 GLM 5V Turbo none Z.ai 6.5 6.2 1/2 1.97s
#59 Qwen3.5-Flash none Qwen 6.3 6.2 1/2 8.81s
#62 Gemini 2.5 Flash none Google 8.0 6.2 1/2 672ms
#63 Qwen3.5-35B-A3B none Qwen 6.3 6.1 1/2 809ms
#65 MiMo-V2-Pro none Xiaomi 6.5 6.0 1/2 2.51s
#66 GPT-5.4 none OpenAI 6.5 5.9 1/2 1.07s
#69 Kimi K2.6 none Moonshot AI 6.5 5.8 1/2 1.64s
#71 MiniMax M2.5 medium Minimax 8.1 5.7 1/2 4.64s
#72 Hunter Alpha none OpenRouter 6.4 5.7 1/2 2.82s
#73 Mistral Small 4 medium Mistral 7.3 5.7 1/2 1.38s
#74 GLM 4.7 Flash none Z.ai 6.5 5.6 1/2 888ms
#75 GLM 5.1 none Z.ai 8.3 5.6 1/2 1.58s
#76 Kimi K2.5 none Moonshot AI 6.5 5.5 1/2 2.67s

Top-Modelle nach Befolgung von Anweisungen-Score

Befolgung von Anweisungen-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)