नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Opus 4.8 vs Xiaomi: MiMo-V2.5

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-28

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 none रिलीज़: 2026-05-28 MiMo-V2.5 MiMo-V2.5 medium रिलीज़: 2026-04-22
स्कोर 7.3 7.4
रैंक #63 #57
विश्वसनीयता 10.0 10.0
संगति 9.2 8.4
सही परीक्षण
प्रति प्रयास पास दर 65.0% 70.0%
अस्थिर टेस्ट 2 4
कुल रन 60 60
प्रति परिणाम लागत 4.324 2.876
कुल लागत $0.519 $0.052
इनपुट कीमत $5.000 / 1M $0.140 / 1M
आउटपुट कीमत $25.000 / 1M $0.280 / 1M
आउटपुट टोकन 8,098 2,806
रीजनिंग टोकन 0 161,888
प्रतिक्रिया समय (औसत) 3.51s 20.35s
प्रतिक्रिया समय (अधिकतम) 17.73s 97.49s
प्रतिक्रिया समय (कुल) 70.19s 406.94s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
MiMo-V2.5 10.0 10.0 100.0% 0 4.14s 281 1,739
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
MiMo-V2.5 6.9 6.2 66.7% 1 64.48s 536 44,967
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
MiMo-V2.5 5.4 2.5 66.7% 1 5.37s 121 418
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
MiMo-V2.5 8.2 7.2 88.9% 1 20.25s 279 33,254
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
MiMo-V2.5 3.0 10.0 0.0% 0 51.29s 22 15,484

त्वरित तुलना

तुलना जोड़ी बदलें