AI BENCHY Kategorie
Anti-KI-Tricks-Ranking
Sieh, welche KI-Modelle bei Anti-KI-Tricks am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Antwortzeit (Durchschnitt) ↑.
Angezeigte Modelle
15
Durchschnittlicher Wert für Anti-KI-Tricks-Score
6.9
Bestes Modell
Mistral Small 4 3.4| Rang | Modell | Unternehmen | Anti-KI-Tricks-Score | Punktzahl | Korrekte Tests | Antwortzeit (Durchschnitt) |
|---|---|---|---|---|---|---|
| #153 | Qwen3.6 35B A3B none | Qwen | 3.6 | 4.6 | 0/4 | 2.10s |
| #112 | GLM 5.1 none | Z.ai | 4.0 | 5.7 | 0/4 | 2.11s |
| #50 | Gemini 3.1 Flash Lite Preview low | 8.3 | 7.4 | 3/4 | 2.12s | |
| #8 | Claude Opus 4.7 none | Anthropic | 8.3 | 8.9 | 3/4 | 2.12s |
| #143 | MiMo-V2.5 none | Xiaomi | 3.5 | 4.9 | 0/4 | 2.19s |
| #40 | Gemini 3.1 Flash Lite Preview medium | 9.1 | 7.5 | 3/4 | 2.33s | |
| #104 | Nemotron 3 Ultra 550b A55b none | NVIDIA | 3.5 | 6.0 | 0/4 | 2.35s |
| #98 | GLM 5 none | Z.ai | 4.8 | 6.1 | 1/4 | 2.37s |
| #44 | Gemini 3.1 Flash Lite medium | 9.1 | 7.5 | 3/4 | 2.39s | |
| #110 | Seed-2.0-Lite none | Bytedance Seed | 3.0 | 5.8 | 0/4 | 2.43s |
| #3 | Gemini 3.5 Flash low | 10.0 | 9.4 | 4/4 | 2.52s | |
| #20 | Gemini 3.5 Flash none | 10.0 | 8.1 | 4/4 | 2.53s | |
| #2 | Gemini 3.5 Flash high | 10.0 | 9.6 | 4/4 | 2.57s | |
| #74 | Qwen3.6 Max Preview none | Qwen | 5.2 | 6.9 | 1/4 | 2.63s |
| #132 | Mistral Small 4 medium | Mistral | 5.6 | 5.3 | 1/4 | 2.67s |