नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

OpenAI: GPT-5.3 Chat vs Xiaomi: MiMo-V2-Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक GPT-5.3 Chat GPT-5.3 Chat none रिलीज़: 2026-03-03 MiMo-V2-Flash MiMo-V2-Flash medium रिलीज़: 2025-12-16
स्कोर 7.7 7.5
रैंक #35 #40
संगति 8.6 8.6
सही परीक्षण
प्रति प्रयास पास दर 68.5% 70.4%
अस्थिर टेस्ट 3 3
कुल रन 54 54
प्रति परिणाम लागत 3.082 0.341
कुल लागत $0.340 $0.038
???? ??? $1.750 / 1M $0.090 / 1M
????? ??? $14.000 / 1M $0.290 / 1M
आउटपुट टोकन 20,784 12,387
रीजनिंग टोकन 0 115,182
प्रतिक्रिया समय (औसत) 5.88s 23.36s
प्रतिक्रिया समय (अधिकतम) 18.33s 96.01s
प्रतिक्रिया समय (कुल) 105.90s 280.34s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 3,167 0
MiMo-V2-Flash 8.1 7.9 83.3% 1 15.85s 1,674 23,559
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 9.32s 1,436 0
MiMo-V2-Flash 4.7 1.6 66.7% 1 13.03s 428 3,648
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
MiMo-V2-Flash 9.8 10.0 100.0% 0 75.68s 442 26,859
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
MiMo-V2-Flash 6.5 10.0 50.0% 0 0ms 153 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
MiMo-V2-Flash 5.9 7.2 55.6% 1 96.01s 8,374 42,461
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
MiMo-V2-Flash 4.0 10.0 0.0% 0 4.20s 87 488
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 8.3 10.0 50.0% 0 3.29s 1,455 0
MiMo-V2-Flash 10.0 10.0 100.0% 0 4.28s 75 3,504
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
MiMo-V2-Flash 7.7 10.0 66.7% 0 3.77s 833 1,948
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
MiMo-V2-Flash 10.0 10.0 100.0% 0 27.78s 321 12,715

त्वरित तुलना

तुलना जोड़ी बदलें