नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: gpt-oss-120b vs Xiaomi: MiMo-V2.5-Pro

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-22

मेट्रिक gpt-oss-120b gpt-oss-120b none रिलीज़: 2025-08-05 निःशुल्क उपलब्ध MiMo-V2.5-Pro MiMo-V2.5-Pro none रिलीज़: 2026-04-22
स्कोर 5.2 5.6
रैंक #129 #115
विश्वसनीयता 10.0 10.0
संगति 8.7 8.5
सही परीक्षण
प्रति प्रयास पास दर 36.8% 41.7%
अस्थिर टेस्ट 3 4
कुल रन 57 60
प्रति परिणाम लागत 0.201 0.637
कुल लागत $0.011 $0.039
???? ??? $0.000 / 1M $1.000 / 1M
????? ??? $0.000 / 1M $3.000 / 1M
आउटपुट टोकन 51,505 3,067
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 21.86s 1.84s
प्रतिक्रिया समय (अधिकतम) 113.71s 8.32s
प्रतिक्रिया समय (कुल) 349.78s 36.84s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.5 10.0 50.0% 0 32.84s 8,676 0
MiMo-V2.5-Pro 3.3 8.1 8.3% 1 2.67s 994 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
MiMo-V2.5-Pro 5.0 6.7 33.3% 1 1.80s 479 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 3.54s 596 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 1.32s 249 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 877ms 27 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.8 10.0 0.0% 0 10.79s 615 0
MiMo-V2.5-Pro 4.0 10.0 0.0% 0 2.58s 87 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 9.8 10.0 100.0% 0 5.10s 1,982 0
MiMo-V2.5-Pro 6.4 10.0 50.0% 0 1.03s 66 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.4 4.5 44.5% 2 9.51s 3,781 0
MiMo-V2.5-Pro 6.7 4.7 77.8% 2 1.32s 297 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.30s 258 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 47.29s 3,138 0
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 1.89s 14 0

त्वरित तुलना

तुलना जोड़ी बदलें