AI BENCHY
Advertise here

AI BENCHY श्रेणी विफलताएँ

डोमेन-विशिष्ट: API त्रुटि

डोमेन-विशिष्ट
API त्रुटि

देखें कि डोमेन-विशिष्ट में किन AI मॉडलों में API त्रुटि आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें। क्रमबद्ध करें: सही परीक्षण ↑.

दिखाए गए मॉडल

6

कुल विफलताएँ

6

सबसे अधिक प्रभावित मॉडल

Qwen3.6 Plus Preview 1
रैंक मॉडल कंपनी API त्रुटि संख्या श्रेणी स्कोर सही परीक्षण प्रतिक्रिया समय (औसत)
#93 Qwen3.6 Plus Preview medium Qwen 1 3.0 0/3 22.1s
#103 DeepSeek V4 Pro high DeepSeek 1 2.9 0/3 205.7s
#133 DeepSeek V3.2 none DeepSeek 1 2.9 0/3 4.17s
#156 Hy3 preview none Tencent 1 3.6 0/3 17.6s
#132 Mistral Small 4 medium Mistral 1 5.3 1/3 6.11s
#160 LFM2-24B-A2B none Liquid 1 5.9 1/3 287ms

API त्रुटि संख्या के अनुसार शीर्ष मॉडल

API त्रुटि संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल

अनुमानित व्यर्थ लागत के अनुसार शीर्ष मॉडल