AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

إخفاقات AI BENCHY

إخفاقات خطأ API

اكتشف أي نماذج الذكاء الاصطناعي تواجه خطأ API أكثر من غيرها، حتى ترى مخاطر الاعتمادية قبل الاختيار. الترتيب حسب: زمن الاستجابة (المتوسط) ↑.

النماذج المعروضة

3

إجمالي الإخفاقات

27

النموذج الأكثر تأثرًا

Step 3.5 Flash 1
الترتيب النموذج الشركة عدد خطأ API النتيجة اختبارات صحيحة زمن الاستجابة (المتوسط)
#14 Gemma 4 31B medium Google 2 8.3 13/18 24.9s
#43 Qwen3.5-35B-A3B medium Qwen 1 7.4 10/18 44.5s
#32 Qwen3.5-Flash medium Qwen 1 7.8 11/18 66.7s

أفضل النماذج حسب عدد خطأ API

عدد خطأ API مقابل النتيجة

أفضل النماذج حسب زمن الاستجابة (المتوسط)