AI BENCHY श्रेणी विफलताएँ
पहेली समाधान: अतिरिक्त फॉर्मेटिंग
पहेली समाधान
अतिरिक्त फॉर्मेटिंग
देखें कि पहेली समाधान में किन AI मॉडलों में अतिरिक्त फॉर्मेटिंग आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें।
विफलता के कारण
| रैंक | मॉडल | कंपनी | अतिरिक्त फॉर्मेटिंग संख्या | श्रेणी स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #51 | Mimo V2 PRO medium | Xiaomi | 1 | 6.4 | 1/3 | 5.08s |
| #68 | Claude Opus 4.8 none | Anthropic | 1 | 7.7 | 2/3 | 2.74s |
| #77 | Claude Sonnet 4.6 none | Anthropic | 1 | 7.7 | 2/3 | 2.53s |
| #113 | DeepSeek V4 Pro none | DeepSeek | 1 | 7.6 | 2/3 | 16.0s |
| #139 | DeepSeek V4 Flash none | DeepSeek | 1 | 3.1 | 0/3 | 23.7s |