AI BENCHY श्रेणी विफलताएँ
पहेली समाधान: अतिरिक्त फॉर्मेटिंग
पहेली समाधान
अतिरिक्त फॉर्मेटिंग
देखें कि पहेली समाधान में किन AI मॉडलों में अतिरिक्त फॉर्मेटिंग आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें। क्रमबद्ध करें: सही परीक्षण ↓.
विफलता के कारण
| रैंक | मॉडल | कंपनी | अतिरिक्त फॉर्मेटिंग संख्या | श्रेणी स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #68 | Claude Opus 4.8 none | Anthropic | 1 | 7.7 | 2/3 | 2.74s |
| #77 | Claude Sonnet 4.6 none | Anthropic | 1 | 7.7 | 2/3 | 2.53s |
| #113 | DeepSeek V4 Pro none | DeepSeek | 1 | 7.6 | 2/3 | 16.0s |
| #51 | Mimo V2 PRO medium | Xiaomi | 1 | 6.4 | 1/3 | 5.08s |
| #139 | DeepSeek V4 Flash none | DeepSeek | 1 | 3.1 | 0/3 | 23.7s |