नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Anthropic: Claude Sonnet 4.6 vs Xiaomi: MiMo-V2.5-Pro

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-22

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 none रिलीज़: 2026-02-17 MiMo-V2.5-Pro MiMo-V2.5-Pro medium रिलीज़: 2026-04-22
स्कोर 7.4 8.1
रैंक #44 #23
संगति 9.6 8.8
सही परीक्षण
प्रति प्रयास पास दर 64.8% 75.9%
अस्थिर टेस्ट 1 3
कुल रन 54 54
प्रति परिणाम लागत 2.376 1.674
कुल लागत $0.262 $0.201
???? ??? $3.000 / 1M $1.000 / 1M
????? ??? $15.000 / 1M $3.000 / 1M
आउटपुट टोकन 7,433 2,735
रीजनिंग टोकन 0 52,571
प्रतिक्रिया समय (औसत) 4.98s 16.17s
प्रतिक्रिया समय (अधिकतम) 23.84s 84.22s
प्रतिक्रिया समय (कुल) 54.83s 291.09s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 1,214 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 2.95s 273 1,363
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.67s 523 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 32.58s 543 7,485
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 3,766 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 348 11,870
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 252 0
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 260 8,383
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 413 0
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 275 17,023
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 192 0
MiMo-V2.5-Pro 5.1 3.3 33.3% 1 4.27s 150 549
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 90 0
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 82 803
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.92s 536 0
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.16s 493 2,187
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 447 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 311 2,908

त्वरित तुलना

तुलना जोड़ी बदलें