नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Opus 4.6 vs Xiaomi: MiMo-V2-Omni

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-07

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium रिलीज़: 2026-02-05 MiMo-V2-Omni MiMo-V2-Omni none रिलीज़: 2026-03-18
स्कोर 7.5 6.4
रैंक #35 #51
संगति 9.0 10.0
सही परीक्षण
प्रति प्रयास पास दर 68.6% 47.1%
अस्थिर टेस्ट 2 0
कुल रन 51 17
प्रति परिणाम लागत 11.973 0.069
कुल लागत $1.317 $0.006
???? ??? $5.000 / 1M $0.400 / 1M
????? ??? $25.000 / 1M $2.000 / 1M
आउटपुट टोकन 26,343 469
रीजनिंग टोकन 17,434 0
प्रतिक्रिया समय (औसत) 20.87s 2.01s
प्रतिक्रिया समय (अधिकतम) 83.40s 6.81s
प्रतिक्रिया समय (कुल) 208.73s 34.09s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
MiMo-V2-Omni 4.8 10.0 25.0% 0 1.10s 74 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
MiMo-V2-Omni 3.0 10.0 0.0% 0 2.47s 110 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
MiMo-V2-Omni 10.0 10.0 100.0% 0 1.69s 83 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
MiMo-V2-Omni 5.3 10.0 33.3% 0 1.14s 8 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
MiMo-V2-Omni 4.5 10.0 0.0% 0 1.19s 37 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
MiMo-V2-Omni 6.5 10.0 50.0% 0 4.18s 22 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
MiMo-V2-Omni 8.0 10.0 66.7% 0 2.71s 58 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.76s 77 0

त्वरित तुलना

तुलना जोड़ी बदलें