नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Anthropic: Claude Opus 4.6 vs Xiaomi: MiMo-V2-Omni

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-01

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium रिलीज़: 2026-02-05 MiMo-V2-Omni MiMo-V2-Omni medium रिलीज़: 2026-03-18
स्कोर 7.6 7.7
रैंक #50 #49
विश्वसनीयता लागू नहीं लागू नहीं
संगति 9.1 9.9
सही परीक्षण
प्रति प्रयास पास दर 70.4% 61.1%
अस्थिर टेस्ट 2 0
कुल रन 54 20
प्रति परिणाम लागत 12.047 1.383
कुल लागत $1.446 $0.153
???? ??? $5.000 / 1M $0.400 / 1M
????? ??? $25.000 / 1M $2.000 / 1M
आउटपुट टोकन 29,829 928
रीजनिंग टोकन 18,938 72,661
प्रतिक्रिया समय (औसत) 21.08s 16.76s
प्रतिक्रिया समय (अधिकतम) 83.40s 158.78s
प्रतिक्रिया समय (कुल) 231.84s 301.61s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.11s 112 402
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
MiMo-V2-Omni 4.0 7.9 0.0% 0 68.55s 265 33,660
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
MiMo-V2-Omni 10.0 10.0 100.0% 0 19.29s 131 2,807
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.29s 87 323
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
MiMo-V2-Omni 3.0 10.0 0.0% 0 55.12s 13 33,279
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.86s 58 202
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
MiMo-V2-Omni 8.3 10.0 50.0% 0 4.92s 35 201
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
MiMo-V2-Omni 6.5 10.0 33.3% 0 3.88s 126 481
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
MiMo-V2-Omni 10.0 10.0 100.0% 0 11.07s 101 1,306

त्वरित तुलना

तुलना जोड़ी बदलें