नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Opus 4.6 vs Xiaomi: MiMo-V2.5

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-22

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium रिलीज़: 2026-02-05 MiMo-V2.5 MiMo-V2.5 medium रिलीज़: 2026-04-22
स्कोर 7.2 7.4
रैंक #63 #53
विश्वसनीयता 10.0 10.0
संगति 9.1 8.4
सही परीक्षण
प्रति प्रयास पास दर 63.3% 70.0%
अस्थिर टेस्ट 2 4
कुल रन 60 60
प्रति परिणाम लागत 15.798 2.877
कुल लागत $1.896 $0.346
???? ??? $5.000 / 1M $0.400 / 1M
????? ??? $25.000 / 1M $2.000 / 1M
आउटपुट टोकन 42,253 2,891
रीजनिंग टोकन 23,561 161,845
प्रतिक्रिया समय (औसत) 25.44s 20.40s
प्रतिक्रिया समय (अधिकतम) 83.40s 97.49s
प्रतिक्रिया समय (कुल) 330.70s 407.98s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
MiMo-V2.5 10.0 10.0 100.0% 0 4.14s 281 1,739
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 7.2 9.8 50.0% 0 29.37s 7,865 3,675
MiMo-V2.5 6.9 6.2 66.7% 1 64.48s 536 44,967
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
MiMo-V2.5 5.4 2.5 66.7% 1 5.37s 121 418
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 3.0 10.0 0.0% 0 63.24s 8,045 2,452
MiMo-V2.5 3.0 10.0 0.0% 0 51.29s 22 15,484

त्वरित तुलना

तुलना जोड़ी बदलें