AI BENCHY
Advertise here

AI BENCHY Kategorie

Befolgung von Anweisungen-Ranking

Sieh, welche KI-Modelle bei Befolgung von Anweisungen am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Korrekte Tests ↑.

Angezeigte Modelle

13

Durchschnittlicher Wert für Befolgung von Anweisungen-Score

8.5

Bestes Modell

MiniMax M2.7 3.8
Rang Modell Unternehmen Befolgung von Anweisungen-Score Punktzahl Korrekte Tests Antwortzeit (Durchschnitt)
#99 gpt-oss-120b medium OpenAI 9.9 6.1 2/2 7.63s
#100 Grok Build 0.1 none X AI 9.8 6.0 2/2 7.36s
#103 DeepSeek V4 Pro high DeepSeek 10.0 6.0 2/2 41.2s
#104 Nemotron 3 Ultra 550b A55b none NVIDIA 10.0 6.0 2/2 1.46s
#107 Laguna Xs.2 medium Poolside 10.0 5.8 2/2 1.68s
#110 Seed-2.0-Lite none Bytedance Seed 10.0 5.8 2/2 1.06s
#112 GLM 5.1 none Z.ai 9.8 5.7 2/2 1.98s
#119 Cobuddy medium Baidu 9.8 5.6 2/2 11.6s
#126 gpt-oss-120b none OpenAI 9.8 5.4 2/2 5.06s
#133 DeepSeek V3.2 none DeepSeek 10.0 5.2 2/2 1.52s
#136 Elephant Alpha medium Openrouter 9.8 5.1 2/2 987ms
#137 Elephant Alpha none Openrouter 9.8 5.1 2/2 1.03s
#138 Ling-2.6-flash none Inclusionai 9.8 5.0 2/2 5.52s

Top-Modelle nach Befolgung von Anweisungen-Score

Befolgung von Anweisungen-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)