AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

إخفاقات الفئات في AI BENCHY

البرمجة: خطأ API

البرمجة
خطأ API

اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور خطأ API في البرمجة، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: اختبارات صحيحة ↑.

النماذج المعروضة

6

إجمالي الإخفاقات

6

النموذج الأكثر تأثرًا

Gemini 3 PRO Preview 1
الترتيب النموذج الشركة عدد خطأ API درجة الفئة اختبارات صحيحة زمن الاستجابة (المتوسط)
#19 Gemini 3 PRO Preview medium Google 1 3.0 0/2 0ms
#32 Step 3.5 Flash none Stepfun 1 3.0 0/1 0ms
#33 Qwen3.6 Plus medium Qwen 1 4.1 0/2 201.7s
#75 Hunter Alpha medium OpenRouter 1 3.0 0/1 0ms
#96 Nemotron 3 Super medium NVIDIA 1 3.1 0/2 62.4s
#108 Hunter Alpha none OpenRouter 1 3.0 0/1 0ms

أفضل النماذج حسب عدد خطأ API

عدد خطأ API مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)

أفضل النماذج حسب التكلفة المهدرة التقديرية