नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Xiaomi: MiMo-V2-Pro

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-20

मेट्रिक GPT-5.4 GPT-5.4 none रिलीज़: 2026-03-05 MiMo-V2-Pro MiMo-V2-Pro none रिलीज़: 2026-03-18
स्कोर 5.6 5.8
रैंक #55 #54
संगति 9.0 8.5
सही परीक्षण
प्रति प्रयास पास दर 39.2% 45.1%
अस्थिर टेस्ट 2 3
कुल रन 51 51
प्रति परिणाम लागत 1.573 0.659
कुल लागत $0.095 $0.040
???? ??? $2.500 / 1M $1.000 / 1M
????? ??? $15.000 / 1M $3.000 / 1M
आउटपुट टोकन 1,837 1,721
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.43s 2.31s
प्रतिक्रिया समय (अधिकतम) 2.89s 6.58s
प्रतिक्रिया समय (कुल) 24.27s 39.25s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.2 8.0 8.3% 1 1.21s 406 0
MiMo-V2-Pro 3.5 8.0 16.7% 1 1.80s 315 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.0 10.0 0.0% 0 2.89s 291 0
MiMo-V2-Pro 3.0 10.0 0.0% 0 6.58s 333 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 1.04s 222 0
MiMo-V2-Pro 10.0 10.0 100.0% 0 1.39s 249 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.3 7.2 44.4% 1 1.07s 50 0
MiMo-V2-Pro 5.3 7.2 44.4% 1 1.78s 26 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 4.4 9.9 0.0% 0 1.78s 184 0
MiMo-V2-Pro 4.3 9.9 0.0% 0 2.44s 125 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 6.5 10.0 50.0% 0 1.07s 81 0
MiMo-V2-Pro 6.5 10.0 50.0% 0 2.51s 69 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.6 9.8 33.3% 0 1.52s 357 0
MiMo-V2-Pro 6.0 7.1 55.6% 1 1.83s 327 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
MiMo-V2-Pro 10.0 10.0 100.0% 0 4.39s 277 0

त्वरित तुलना

तुलना जोड़ी बदलें