فئة AI BENCHY
ترتيب حيل مضادة للذكاء الاصطناعي
اكتشف أي نماذج الذكاء الاصطناعي تؤدي أفضل في حيل مضادة للذكاء الاصطناعي، وأيها يظل أكثر اعتمادية، وأين تظهر أكبر الفجوات.
النماذج المعروضة
15
متوسط درجة حيل مضادة للذكاء الاصطناعي
6.9
أفضل نموذج
Gemini 3 Flash Preview 10.0| الترتيب | النموذج | الشركة | درجة حيل مضادة للذكاء الاصطناعي | النتيجة | اختبارات صحيحة | زمن الاستجابة (المتوسط) |
|---|---|---|---|---|---|---|
| #50 | Gemini 3.1 Flash Lite Preview low | 8.3 | 7.4 | 3/4 | 2.12s | |
| #70 | GPT-5.4 Nano medium | OpenAI | 8.3 | 7.0 | 3/4 | 4.52s |
| #78 | Qwen3.6 27B medium | Qwen | 8.3 | 6.8 | 3/4 | 12.6s |
| #87 | Gemini 3.1 Flash Lite minimal | 8.3 | 6.4 | 3/4 | 1.10s | |
| #89 | Hy3 preview low | Tencent | 8.3 | 6.4 | 3/4 | 9.32s |
| #93 | Qwen3.6 Plus Preview medium | Qwen | 8.3 | 6.3 | 3/4 | 11.7s |
| #102 | Gemma 4 26B A4B none | 8.3 | 6.0 | 3/4 | 1.28s | |
| #105 | Nemotron 3 Super medium | NVIDIA | 8.3 | 5.8 | 3/4 | 7.85s |
| #25 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 8.2 | 7.9 | 3/4 | 45.8s |
| #65 | Grok 4.20 medium | X AI | 8.2 | 7.1 | 3/4 | 3.95s |
| #72 | DeepSeek V3.2 medium | DeepSeek | 8.2 | 7.0 | 3/4 | 24.2s |
| #64 | MiMo-V2-Flash medium | Xiaomi | 8.1 | 7.2 | 3/4 | 15.8s |
| #129 | MiniMax M2.5 medium | Minimax | 7.9 | 5.3 | 2/4 | 20.8s |
| #130 | MiniMax M2.7 medium | Minimax | 7.9 | 5.3 | 2/4 | 40.3s |
| #90 | Gemini 3.1 Flash Lite none | 7.5 | 6.4 | 2/4 | 1.07s |