فئة AI BENCHY
ترتيب حيل مضادة للذكاء الاصطناعي
اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في حيل مضادة للذكاء الاصطناعي، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات.
النماذج المعروضة
15
متوسط درجة حيل مضادة للذكاء الاصطناعي
6.9
أفضل نموذج
Gemini 3 Flash Preview 10.0| الترتيب | النموذج | الشركة | درجة حيل مضادة للذكاء الاصطناعي | النتيجة | اختبارات صحيحة | زمن الاستجابة (المتوسط) |
|---|---|---|---|---|---|---|
| #58 | Gemini 3.1 Flash Lite Preview none | 7.5 | 7.2 | 2/4 | 1.04s | |
| #76 | Kimi K2.5 medium | Moonshot AI | 7.3 | 6.8 | 2/4 | 51.4s |
| #79 | Hunter Alpha medium | OpenRouter | 7.3 | 6.7 | 2/4 | 4.75s |
| #61 | Gemini 3.1 Flash Lite low | 7.3 | 7.2 | 2/4 | 1.84s | |
| #59 | GLM 5V Turbo medium | Z.ai | 7.2 | 7.2 | 2/4 | 10.8s |
| #54 | GPT-5 Mini medium | OpenAI | 7.1 | 7.3 | 2/4 | 13.9s |
| #60 | Kimi K2.6 medium | Moonshot AI | 7.0 | 7.2 | 2/4 | 11.6s |
| #91 | GPT-5.5 none | OpenAI | 6.9 | 6.4 | 2/4 | 1.31s |
| #107 | Laguna Xs.2 medium | Poolside | 6.9 | 5.8 | 2/4 | 2.68s |
| #81 | Mercury 2 medium | Inception | 6.9 | 6.6 | 2/4 | 1.12s |
| #84 | Grok 4.20 Multi Agent Beta medium | X AI | 6.9 | 6.6 | 2/4 | 3.46s |
| #138 | Ling-2.6-flash none | Inclusionai | 6.8 | 5.0 | 2/4 | 11.8s |
| #63 | GPT-5.3 Chat none | OpenAI | 6.7 | 7.2 | 2/4 | 3.86s |
| #99 | gpt-oss-120b medium | OpenAI | 6.7 | 6.1 | 2/4 | 10.2s |
| #73 | Seed-2.0-Mini medium | Bytedance Seed | 6.6 | 6.9 | 2/4 | 74.7s |