AI BENCHY
قارن الرسوم البيانية المنهجية
❤️ Made by XCS
Your ad here

إخفاقات الفئات في AI BENCHY

حيل مضادة للذكاء الاصطناعي
تنسيق إضافي

اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور تنسيق إضافي في حيل مضادة للذكاء الاصطناعي، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: زمن الاستجابة (المتوسط) ↓.

النماذج المعروضة

5

إجمالي الإخفاقات

8

النموذج الأكثر تأثرًا

Claude Opus 4.6 2
الترتيب النموذج الشركة عدد تنسيق إضافي درجة الفئة اختبارات صحيحة زمن الاستجابة (المتوسط)
#26 Claude Opus 4.6 medium Anthropic 2 4.0 1/3 11.9s
#33 DeepSeek V3.2 none DeepSeek 2 10.0 0/3 8.79s
#11 Claude Sonnet 4.6 medium Anthropic 1 7.0 2/3 4.95s
#25 Claude Sonnet 4.6 none Anthropic 2 4.0 1/3 4.83s
#48 Qwen3 Coder Next none Qwen 1 2.3 0/3 4.39s

أفضل النماذج حسب عدد تنسيق إضافي

عدد تنسيق إضافي مقابل متوسط الدرجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)

أفضل النماذج حسب التكلفة المهدرة التقديرية