AI BENCHY
Advertise here

إخفاقات الفئات في AI BENCHY

البرمجة: خطأ API

البرمجة
خطأ API

اكتشف أي نماذج الذكاء الاصطناعي هي الأكثر عرضة لظهور خطأ API في البرمجة، حتى ترصد نقاط الضعف بسرعة أكبر. الترتيب حسب: زمن الاستجابة (المتوسط) ↑.

النماذج المعروضة

6

إجمالي الإخفاقات

6

النموذج الأكثر تأثرًا

Gemini 3 PRO Preview 1
الترتيب النموذج الشركة عدد خطأ API درجة الفئة اختبارات صحيحة زمن الاستجابة (المتوسط)
#19 Gemini 3 PRO Preview medium Google 1 3.0 0/2 0ms
#32 Step 3.5 Flash none Stepfun 1 3.0 0/1 0ms
#75 Hunter Alpha medium OpenRouter 1 3.0 0/1 0ms
#108 Hunter Alpha none OpenRouter 1 3.0 0/1 0ms
#96 Nemotron 3 Super medium NVIDIA 1 3.1 0/2 62.4s
#33 Qwen3.6 Plus medium Qwen 1 4.1 0/2 201.7s

أفضل النماذج حسب عدد خطأ API

عدد خطأ API مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)

أفضل النماذج حسب التكلفة المهدرة التقديرية