AI BENCHY श्रेणी विफलताएँ
डेटा पार्सिंग और निष्कर्षण: कोई उत्तर नहीं
डेटा पार्सिंग और निष्कर्षण
कोई उत्तर नहीं
देखें कि डेटा पार्सिंग और निष्कर्षण में किन AI मॉडलों में कोई उत्तर नहीं आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें। क्रमबद्ध करें: विफलता संख्या ↑.
विफलता के कारण
| रैंक | मॉडल | कंपनी | कोई उत्तर नहीं संख्या | श्रेणी स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #17 | GLM 5 medium | Z.ai | 1 | 7.1 | 1/2 | 8.90s |
| #107 | Laguna Xs.2 medium | Poolside | 1 | 7.1 | 1/2 | 9.34s |
| #158 | GLM 4.7 Flash medium | Z.ai | 1 | 6.3 | 1/2 | 1.51s |
| #78 | Qwen3.6 27B medium | Qwen | 2 | 3.5 | 0/2 | 37.3s |