فئة AI BENCHY
ترتيب حيل مضادة للذكاء الاصطناعي
اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في حيل مضادة للذكاء الاصطناعي، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات. الترتيب حسب: اختبارات صحيحة ↓.
النماذج المعروضة
15
متوسط درجة حيل مضادة للذكاء الاصطناعي
6.9
أفضل نموذج
Gemini 3 Flash Preview 10.0| الترتيب | النموذج | الشركة | درجة حيل مضادة للذكاء الاصطناعي | النتيجة | اختبارات صحيحة | زمن الاستجابة (المتوسط) |
|---|---|---|---|---|---|---|
| #23 | GLM 5 Turbo medium | Z.ai | 10.0 | 8.0 | 4/4 | 4.82s |
| #26 | Qwen3.6 Plus medium | Qwen | 10.0 | 7.9 | 4/4 | 9.90s |
| #27 | Gemma 4 31B medium | 10.0 | 7.8 | 4/4 | 12.9s | |
| #29 | Qwen3.5-122B-A10B medium | Qwen | 10.0 | 7.8 | 4/4 | 9.75s |
| #33 | Hy3 preview medium | Tencent | 10.0 | 7.7 | 4/4 | 6.59s |
| #35 | Gemini 3 PRO Preview medium | 10.0 | 7.6 | 4/4 | 15.0s | |
| #36 | Qwen3.5 Plus 2026-04-20 medium | Qwen | 10.0 | 7.6 | 4/4 | 10.8s |
| #37 | Gemma 4 26B A4B medium | 10.0 | 7.6 | 4/4 | 6.20s | |
| #38 | Grok 4.3 medium | X AI | 10.0 | 7.6 | 4/4 | 8.83s |
| #39 | Qwen3.6 Flash medium | Qwen | 10.0 | 7.5 | 4/4 | 6.10s |
| #41 | Nemotron 3 Ultra 550b A55b medium | NVIDIA | 10.0 | 7.5 | 4/4 | 8.62s |
| #43 | MiMo-V2.5-Pro medium | Xiaomi | 10.0 | 7.5 | 4/4 | 3.26s |
| #46 | Qwen3.6 35B A3B medium | Qwen | 10.0 | 7.4 | 4/4 | 6.02s |
| #49 | Qwen3.5-Flash medium | Qwen | 10.0 | 7.4 | 4/4 | 59.1s |
| #51 | Mimo V2 PRO medium | Xiaomi | 10.0 | 7.4 | 4/4 | 2.86s |