नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

xAI: Grok 4.20 vs Xiaomi: MiMo-V2.5-Pro

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-22

मेट्रिक Grok 4.20 Grok 4.20 medium रिलीज़: 2026-03-31 MiMo-V2.5-Pro MiMo-V2.5-Pro none रिलीज़: 2026-04-22
स्कोर 7.0 5.8
रैंक #49 #72
संगति 7.8 8.3
सही परीक्षण
प्रति प्रयास पास दर 66.7% 46.3%
अस्थिर टेस्ट 5 4
कुल रन 54 54
प्रति परिणाम लागत 8.252 0.535
कुल लागत $0.743 $0.033
???? ??? $2.000 / 1M $1.000 / 1M
????? ??? $6.000 / 1M $3.000 / 1M
आउटपुट टोकन 1,744 2,451
रीजनिंग टोकन 109,882 0
प्रतिक्रिया समय (औसत) 10.33s 1.51s
प्रतिक्रिया समय (अधिकतम) 29.87s 3.54s
प्रतिक्रिया समय (कुल) 185.87s 27.21s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 8.2 7.9 83.3% 1 3.36s 280 8,476
MiMo-V2.5-Pro 2.9 7.9 8.3% 1 1.29s 366 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 4.3 1.1 66.7% 1 24.33s 250 12,804
MiMo-V2.5-Pro 6.4 3.3 66.7% 1 2.39s 452 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 3.54s 596 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 1.32s 249 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 877ms 27 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 5.8 2.8 66.7% 1 7.09s 47 4,252
MiMo-V2.5-Pro 4.5 10.0 0.0% 0 1.53s 140 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 7.3 5.9 83.3% 1 4.42s 40 5,474
MiMo-V2.5-Pro 6.4 10.0 50.0% 0 1.03s 66 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 6.4 7.7 55.6% 1 3.89s 143 8,028
MiMo-V2.5-Pro 6.7 4.7 77.8% 2 1.32s 297 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.30s 258 0

त्वरित तुलना

तुलना जोड़ी बदलें