إخفاقات الفئات في AI BENCHY
حيل مضادة للذكاء الاصطناعي
تنسيق إضافي
حيل مضادة للذكاء الاصطناعي
تنسيق إضافي
اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور تنسيق إضافي في حيل مضادة للذكاء الاصطناعي، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: زمن الاستجابة (المتوسط) ↑.
أسباب الإخفاق المرتبطة
الفئات المرتبطة
| الترتيب | النموذج | الشركة | عدد تنسيق إضافي | درجة الفئة | اختبارات صحيحة | زمن الاستجابة (المتوسط) |
|---|---|---|---|---|---|---|
| #48 | Qwen3 Coder Next none | Qwen | 1 | 2.3 | 0/3 | 4.39s |
| #25 | Claude Sonnet 4.6 none | Anthropic | 2 | 4.0 | 1/3 | 4.83s |
| #11 | Claude Sonnet 4.6 medium | Anthropic | 1 | 7.0 | 2/3 | 4.95s |
| #33 | DeepSeek V3.2 none | DeepSeek | 2 | 10.0 | 0/3 | 8.79s |
| #26 | Claude Opus 4.6 medium | Anthropic | 2 | 4.0 | 1/3 | 11.9s |