नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Inception: Mercury 2 vs Xiaomi: MiMo-V2-Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-01

मेट्रिक Mercury 2 Mercury 2 none रिलीज़: 2026-02-24 MiMo-V2-Flash MiMo-V2-Flash none रिलीज़: 2025-12-16
स्कोर 4.8 4.5
रैंक #125 #129
विश्वसनीयता लागू नहीं लागू नहीं
संगति 9.0 7.8
सही परीक्षण
प्रति प्रयास पास दर 27.8% 27.8%
अस्थिर टेस्ट 2 5
कुल रन 54 54
प्रति परिणाम लागत 0.165 0.753
कुल लागत $0.007 $0.023
???? ??? $0.250 / 1M $0.090 / 1M
????? ??? $0.750 / 1M $0.290 / 1M
आउटपुट टोकन 1,625 68,522
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 613ms 2.79s
प्रतिक्रिया समय (अधिकतम) 1.27s 19.68s
प्रतिक्रिया समय (कुल) 11.04s 39.08s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 483ms 286 0
MiMo-V2-Flash 3.2 8.0 8.3% 1 1.19s 865 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.6 8.9 0.0% 0 969ms 310 0
MiMo-V2-Flash 6.3 3.7 33.3% 1 2.79s 726 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.0 10.0 0.0% 0 606ms 131 0
MiMo-V2-Flash 3.0 10.0 0.0% 0 2.87s 330 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 7.3 5.9 83.3% 1 667ms 180 0
MiMo-V2-Flash 2.9 5.8 16.7% 1 19.68s 161 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 5.3 7.2 44.4% 1 534ms 46 0
MiMo-V2-Flash 5.3 7.2 44.4% 1 564ms 24 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 4.8 10.0 0.0% 0 628ms 159 0
MiMo-V2-Flash 4.6 10.0 0.0% 0 1.67s 104 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 6.5 10.0 50.0% 0 551ms 82 0
MiMo-V2-Flash 6.5 10.0 50.0% 0 857ms 69 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.1 10.0 0.0% 0 533ms 234 0
MiMo-V2-Flash 3.6 7.2 22.2% 1 1.38s 65,971 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
MiMo-V2-Flash 10.0 10.0 100.0% 0 2.28s 272 0

त्वरित तुलना

तुलना जोड़ी बदलें