नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.3 Chat vs Xiaomi: MiMo-V2-Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-04

मेट्रिक GPT-5.3 Chat GPT-5.3 Chat none रिलीज़: 2026-03-03 MiMo-V2-Flash MiMo-V2-Flash medium रिलीज़: 2025-12-16
स्कोर 7.2 7.2
रैंक #63 #64
विश्वसनीयता 10.0 10.0
संगति 8.1 8.8
सही परीक्षण
प्रति प्रयास पास दर 66.7% 65.1%
अस्थिर टेस्ट 5 3
कुल रन 63 63
प्रति परिणाम लागत 3.605 0.343
कुल लागत $0.433 $0.043
इनपुट कीमत $1.750 / 1M $0.100 / 1M
आउटपुट कीमत $14.000 / 1M $0.300 / 1M
कुल इनपुट टोकन 34,209 40,111
आउटपुट टोकन 26,617 12,476
रीजनिंग टोकन 0 125,039
प्रतिक्रिया समय (औसत) 6.34s 20.11s
प्रतिक्रिया समय (अधिकतम) 18.33s 96.01s
प्रतिक्रिया समय (कुल) 133.13s 301.59s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 606 3,167 0
MiMo-V2-Flash 8.1 7.9 83.3% 1 15.85s 621 1,674 23,559
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 5.6 4.7 55.6% 2 10.52s 7,302 6,632 0
MiMo-V2-Flash 6.0 7.2 55.6% 1 10.71s 7,177 474 13,505
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 11,019 2,614 0
MiMo-V2-Flash 9.8 10.0 100.0% 0 75.68s 18,676 442 26,859
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 7,140 942 0
MiMo-V2-Flash 6.5 10.0 50.0% 0 0ms 2,622 153 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 723 8,264 0
MiMo-V2-Flash 5.9 7.2 55.6% 1 96.01s 739 8,374 42,461
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 477 319 0
MiMo-V2-Flash 4.0 10.0 0.0% 0 4.20s 492 87 488
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 660 1,491 0
MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 678 75 3,504
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 642 1,758 0
MiMo-V2-Flash 7.7 10.0 66.7% 0 3.87s 670 864 1,948
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 5,445 861 0
MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 8,220 321 12,715
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 195 569 0
MiMo-V2-Flash 3.0 10.0 0.0% 0 1.96s 216 12 0

त्वरित तुलना

तुलना जोड़ी बदलें