AI BENCHY
Your ad here

إخفاقات AI BENCHY

إخفاقات خطأ API

اكتشف أي نماذج الذكاء الاصطناعي تواجه خطأ API أكثر من غيرها، حتى ترى مخاطر الاعتمادية قبل الاختيار. الترتيب حسب: اختبارات صحيحة ↑.

النماذج المعروضة

3

إجمالي الإخفاقات

27

النموذج الأكثر تأثرًا

Step 3.5 Flash 1
الترتيب النموذج الشركة عدد خطأ API النتيجة اختبارات صحيحة زمن الاستجابة (المتوسط)
#14 Gemma 4 31B medium Google 2 8.3 13/18 24.9s
#20 Qwen3.6 Plus medium Qwen 1 8.1 13/18 15.3s
#12 Gemini 3 PRO Preview medium Google 1 8.4 14/18 9.06s

أفضل النماذج حسب عدد خطأ API

عدد خطأ API مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)