AI BENCHY श्रेणी विफलताएँ
डोमेन-विशिष्ट
अतिरिक्त फॉर्मेटिंग
डोमेन-विशिष्ट
अतिरिक्त फॉर्मेटिंग
देखें कि डोमेन-विशिष्ट में किन AI मॉडलों में अतिरिक्त फॉर्मेटिंग आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें।
संबंधित विफलता कारण
संबंधित श्रेणियाँ
| रैंक | मॉडल | कंपनी | अतिरिक्त फॉर्मेटिंग संख्या | श्रेणी स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #26 | Claude Opus 4.6 medium | Anthropic | 2 | 10.0 | 0/3 | 83.4s |
| #11 | Claude Sonnet 4.6 medium | Anthropic | 1 | 10.0 | 0/3 | 0ms |