नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Owl Alpha vs Xiaomi: MiMo-V2-Pro

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-30

मेट्रिक Owl Alpha Owl Alpha none रिलीज़: 2026-04-30 MiMo-V2-Pro MiMo-V2-Pro none रिलीज़: 2026-03-18
स्कोर 6.0 6.0
रैंक #87 #86
विश्वसनीयता 10.0 लागू नहीं
संगति 9.1 8.6
सही परीक्षण
प्रति प्रयास पास दर 46.3% 48.2%
अस्थिर टेस्ट 2 3
कुल रन 54 54
प्रति परिणाम लागत 0.000 0.601
कुल लागत $0.000 $0.043
???? ??? $0.000 / 1M $1.000 / 1M
????? ??? $0.000 / 1M $3.000 / 1M
आउटपुट टोकन 1,671 2,320
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 7.07s 2.39s
प्रतिक्रिया समय (अधिकतम) 32.27s 6.58s
प्रतिक्रिया समय (कुल) 127.23s 43.06s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 3.4 7.9 16.7% 1 2.78s 57 0
MiMo-V2-Pro 3.5 8.0 16.7% 1 1.80s 315 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 10.0 10.0 100.0% 0 32.27s 450 0
MiMo-V2-Pro 10.0 10.0 100.0% 0 3.82s 599 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 3.0 10.0 0.0% 0 21.74s 315 0
MiMo-V2-Pro 3.0 10.0 0.0% 0 6.58s 333 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 10.0 10.0 100.0% 0 3.60s 246 0
MiMo-V2-Pro 10.0 10.0 100.0% 0 1.39s 249 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 5.3 10.0 33.3% 0 3.00s 27 0
MiMo-V2-Pro 5.3 7.2 44.4% 1 1.78s 26 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 4.3 10.0 0.0% 0 4.61s 80 0
MiMo-V2-Pro 4.3 9.9 0.0% 0 2.44s 125 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 6.4 10.0 50.0% 0 2.63s 63 0
MiMo-V2-Pro 6.5 10.0 50.0% 0 2.51s 69 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 5.9 7.2 55.6% 1 4.43s 202 0
MiMo-V2-Pro 6.0 7.1 55.6% 1 1.83s 327 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 10.0 10.0 100.0% 0 22.78s 231 0
MiMo-V2-Pro 10.0 10.0 100.0% 0 4.39s 277 0

त्वरित तुलना

तुलना जोड़ी बदलें