AI BENCHY
Your ad here

AI BENCHY Kategorie

Befolgung von Anweisungen-Ranking

Sieh, welche KI-Modelle bei Befolgung von Anweisungen am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Antwortzeit (Durchschnitt) ↑.

Angezeigte Modelle

15

Durchschnittlicher Wert für Befolgung von Anweisungen-Score

8.0

Bestes Modell

Mistral Small 4 6.5
Rang Modell Unternehmen Befolgung von Anweisungen-Score Punktzahl Korrekte Tests Antwortzeit (Durchschnitt)
#83 Mistral Small 4 none Mistral 6.5 5.2 1/2 380ms
#82 Grok 4.20 none X AI 4.8 5.2 0/2 455ms
#90 Qwen3.5-9B none Qwen 6.5 4.8 1/2 514ms
#91 Mercury 2 none Inception 6.5 4.8 1/2 551ms
#70 Qwen3.5-122B-A10B none Qwen 4.5 5.7 0/2 585ms
#62 Gemini 2.5 Flash none Google 8.0 6.2 1/2 672ms
#79 Grok 4.20 Beta none X AI 4.8 5.3 0/2 687ms
#86 GPT-5.4 Mini none OpenAI 6.3 5.1 1/2 728ms
#96 GPT-5.4 Nano none OpenAI 5.0 4.5 0/2 787ms
#63 Qwen3.5-35B-A3B none Qwen 6.3 6.1 1/2 809ms
#67 Qwen3.5-27B none Qwen 4.8 5.9 0/2 815ms
#94 MiMo-V2-Flash none Xiaomi 6.5 4.5 1/2 857ms
#74 GLM 4.7 Flash none Z.ai 6.5 5.6 1/2 888ms
#95 Grok 4.1 Fast none X AI 3.0 4.5 0/2 923ms
#81 Elephant medium Openrouter 9.8 5.2 2/2 987ms

Top-Modelle nach Befolgung von Anweisungen-Score

Befolgung von Anweisungen-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)