AI BENCHY श्रेणी विफलताएँ
डेटा पार्सिंग और निष्कर्षण: कोई उत्तर नहीं
डेटा पार्सिंग और निष्कर्षण
कोई उत्तर नहीं
देखें कि डेटा पार्सिंग और निष्कर्षण में किन AI मॉडलों में कोई उत्तर नहीं आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.
विफलता के कारण
| रैंक | मॉडल | कंपनी | कोई उत्तर नहीं संख्या | श्रेणी स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #78 | Qwen3.6 27B medium | Qwen | 2 | 3.5 | 0/2 | 37.3s |
| #107 | Laguna Xs.2 medium | Poolside | 1 | 7.1 | 1/2 | 9.34s |
| #17 | GLM 5 medium | Z.ai | 1 | 7.1 | 1/2 | 8.90s |
| #158 | GLM 4.7 Flash medium | Z.ai | 1 | 6.3 | 1/2 | 1.51s |