AI BENCHY
Advertise here

AI BENCHY श्रेणी विफलताएँ

सामान्य ज्ञान: कोई उत्तर नहीं

सामान्य ज्ञान
कोई उत्तर नहीं

देखें कि सामान्य ज्ञान में किन AI मॉडलों में कोई उत्तर नहीं आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें। क्रमबद्ध करें: विफलता संख्या ↑.

दिखाए गए मॉडल

6

कुल विफलताएँ

6

सबसे अधिक प्रभावित मॉडल

Claude Opus 4.8 1
रैंक मॉडल कंपनी कोई उत्तर नहीं संख्या श्रेणी स्कोर सही परीक्षण प्रतिक्रिया समय (औसत)
#10 Claude Opus 4.8 medium Anthropic 1 3.0 0/1 6.14s
#22 Step 3.7 Flash medium Stepfun 1 3.0 0/1 114.0s
#57 Step 3.7 Flash low Stepfun 1 3.0 0/1 124.8s
#67 MiniMax M3 medium Minimax 1 3.0 0/1 100.8s
#68 Claude Opus 4.8 none Anthropic 1 3.0 0/1 3.41s
#71 Step 3.7 Flash high Stepfun 1 3.0 0/1 149.3s

कोई उत्तर नहीं संख्या के अनुसार शीर्ष मॉडल

कोई उत्तर नहीं संख्या बनाम स्कोर

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल

अनुमानित व्यर्थ लागत के अनुसार शीर्ष मॉडल