AI BENCHY श्रेणी विफलताएँ
पहेली समाधान: अतिरिक्त फॉर्मेटिंग
पहेली समाधान
अतिरिक्त फॉर्मेटिंग
देखें कि पहेली समाधान में किन AI मॉडलों में अतिरिक्त फॉर्मेटिंग आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.
विफलता के कारण
| रैंक | मॉडल | कंपनी | अतिरिक्त फॉर्मेटिंग संख्या | श्रेणी स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #77 | Claude Sonnet 4.6 none | Anthropic | 1 | 7.7 | 2/3 | 2.53s |
| #68 | Claude Opus 4.8 none | Anthropic | 1 | 7.7 | 2/3 | 2.74s |
| #51 | Mimo V2 PRO medium | Xiaomi | 1 | 6.4 | 1/3 | 5.08s |
| #113 | DeepSeek V4 Pro none | DeepSeek | 1 | 7.6 | 2/3 | 16.0s |
| #139 | DeepSeek V4 Flash none | DeepSeek | 1 | 3.1 | 0/3 | 23.7s |