فئة AI BENCHY
ترتيب حيل مضادة للذكاء الاصطناعي
اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في حيل مضادة للذكاء الاصطناعي، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات.
النماذج المعروضة
15
متوسط درجة حيل مضادة للذكاء الاصطناعي
6.9
أفضل نموذج
Gemini 3 Flash Preview 10.0| الترتيب | النموذج | الشركة | درجة حيل مضادة للذكاء الاصطناعي | النتيجة | اختبارات صحيحة | زمن الاستجابة (المتوسط) |
|---|---|---|---|---|---|---|
| #113 | DeepSeek V4 Pro none | DeepSeek | 3.5 | 5.7 | 0/4 | 14.0s |
| #116 | Hunter Alpha none | OpenRouter | 3.5 | 5.7 | 0/4 | 3.81s |
| #120 | Mimo V2 PRO none | Xiaomi | 3.5 | 5.6 | 0/4 | 1.80s |
| #143 | MiMo-V2.5 none | Xiaomi | 3.5 | 4.9 | 0/4 | 2.19s |
| #148 | GPT-5.4 Nano none | OpenAI | 3.5 | 4.7 | 0/4 | 1.18s |
| #150 | Qwen3 Coder Next medium | Qwen | 3.5 | 4.6 | 0/4 | 8.64s |
| #108 | Qwen3.5-Flash none | Qwen | 3.5 | 5.8 | 0/4 | 1.32s |
| #117 | Qwen3.5-35B-A3B none | Qwen | 3.4 | 5.6 | 0/4 | 1.43s |
| #121 | Owl Alpha none | Openrouter | 3.4 | 5.5 | 0/4 | 2.78s |
| #142 | Mistral Small 4 none | Mistral | 3.4 | 4.9 | 0/4 | 395ms |
| #145 | Laguna M.1 none | Poolside | 3.4 | 4.8 | 0/4 | 705ms |
| #159 | Ling-2.6-1T none | Inclusionai | 3.4 | 4.3 | 0/4 | 6.55s |
| #160 | LFM2-24B-A2B none | Liquid | 3.3 | 4.2 | 0/3 | 471ms |
| #123 | MiMo-V2.5-Pro none | Xiaomi | 3.3 | 5.5 | 0/4 | 2.67s |
| #125 | GPT-5.4 none | OpenAI | 3.2 | 5.5 | 0/4 | 1.21s |