नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.3 Chat vs Xiaomi: MiMo-V2.5

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-22

मेट्रिक GPT-5.3 Chat GPT-5.3 Chat none रिलीज़: 2026-03-03 MiMo-V2.5 MiMo-V2.5 medium रिलीज़: 2026-04-22
स्कोर 7.7 7.8
रैंक #38 #35
संगति 8.6 8.6
सही परीक्षण
प्रति प्रयास पास दर 68.5% 74.1%
अस्थिर टेस्ट 3 3
कुल रन 54 54
प्रति परिणाम लागत 3.082 2.102
कुल लागत $0.340 $0.253
???? ??? $1.750 / 1M $0.400 / 1M
????? ??? $14.000 / 1M $2.000 / 1M
आउटपुट टोकन 20,784 2,840
रीजनिंग टोकन 0 116,242
प्रतिक्रिया समय (औसत) 5.88s 13.71s
प्रतिक्रिया समय (अधिकतम) 18.33s 86.93s
प्रतिक्रिया समय (कुल) 105.90s 246.73s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 3,167 0
MiMo-V2.5 10.0 10.0 100.0% 0 1.98s 303 2,022
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 9.32s 1,436 0
MiMo-V2.5 10.0 10.0 100.0% 0 31.48s 488 14,813
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
MiMo-V2.5 3.8 2.5 33.3% 1 1.55s 118 170
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 8.3 10.0 50.0% 0 3.29s 1,455 0
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424

त्वरित तुलना

तुलना जोड़ी बदलें