नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

xAI: Grok 4.20 vs Xiaomi: MiMo-V2-Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-21

मेट्रिक Grok 4.20 Grok 4.20 none रिलीज़: 2026-03-31 MiMo-V2-Flash MiMo-V2-Flash none रिलीज़: 2025-12-16
स्कोर 5.4 4.5
रैंक #122 #146
विश्वसनीयता लागू नहीं 10.0
संगति 9.5 7.9
सही परीक्षण
प्रति प्रयास पास दर 35.2% 26.3%
अस्थिर टेस्ट 1 5
कुल रन 54 57
प्रति परिणाम लागत 1.574 0.754
कुल लागत $0.095 $0.023
???? ??? $1.250 / 1M $0.100 / 1M
????? ??? $2.500 / 1M $0.300 / 1M
आउटपुट टोकन 1,967 68,534
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.11s 2.73s
प्रतिक्रिया समय (अधिकतम) 6.04s 19.68s
प्रतिक्रिया समय (कुल) 20.02s 40.90s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 4.8 10.0 25.0% 0 501ms 267 0
MiMo-V2-Flash 3.2 8.0 8.3% 1 1.19s 865 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 3.4 9.3 0.0% 0 1.22s 312 0
MiMo-V2-Flash 6.3 3.7 33.3% 1 2.79s 726 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 3.0 10.0 0.0% 0 6.04s 282 0
MiMo-V2-Flash 3.0 10.0 0.0% 0 2.87s 330 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 10.0 10.0 100.0% 0 522ms 207 0
MiMo-V2-Flash 2.9 5.8 16.7% 1 19.68s 161 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 3.0 10.0 0.0% 0 687ms 325 0
MiMo-V2-Flash 5.3 7.2 44.4% 1 564ms 24 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 4.8 10.0 0.0% 0 659ms 83 0
MiMo-V2-Flash 4.6 10.0 0.0% 0 1.67s 104 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 6.3 10.0 50.0% 0 455ms 60 0
MiMo-V2-Flash 6.5 10.0 50.0% 0 857ms 69 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 5.3 7.2 44.4% 1 487ms 242 0
MiMo-V2-Flash 3.6 7.2 22.2% 1 1.38s 65,971 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 10.0 10.0 100.0% 0 4.63s 189 0
MiMo-V2-Flash 10.0 10.0 100.0% 0 2.28s 272 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Grok 4.20 - - - - - - - -
MiMo-V2-Flash 3.0 10.0 0.0% 0 1.82s 12 0

त्वरित तुलना

तुलना जोड़ी बदलें