नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Elephant Alpha vs Xiaomi: MiMo-V2.5

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-22

मेट्रिक Elephant Alpha Elephant Alpha none रिलीज़: 2026-04-14 MiMo-V2.5 MiMo-V2.5 none रिलीज़: 2026-04-22
स्कोर 5.2 5.1
रैंक #89 #92
संगति 9.6 10.0
सही परीक्षण
प्रति प्रयास पास दर 31.5% 27.8%
अस्थिर टेस्ट 1 0
कुल रन 54 54
प्रति परिणाम लागत 0.000 0.368
कुल लागत $0.000 $0.019
???? ??? $0.000 / 1M $0.400 / 1M
????? ??? $0.000 / 1M $2.000 / 1M
आउटपुट टोकन 2,573 2,177
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.23s 1.05s
प्रतिक्रिया समय (अधिकतम) 3.81s 2.43s
प्रतिक्रिया समय (कुल) 22.16s 18.94s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 6.6 10.0 50.0% 0 963ms 610 0
MiMo-V2.5 4.8 10.0 25.0% 0 842ms 232 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 6.4 3.3 66.7% 1 1.39s 375 0
MiMo-V2.5 10.0 10.0 100.0% 0 1.95s 660 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 3.0 10.0 0.0% 0 3.81s 731 0
MiMo-V2.5 3.0 10.0 0.0% 0 2.36s 330 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 6.5 10.0 50.0% 0 1.04s 246 0
MiMo-V2.5 6.5 10.0 50.0% 0 1.01s 366 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 3.0 10.0 0.0% 0 927ms 24 0
MiMo-V2.5 3.0 10.0 0.0% 0 756ms 27 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 4.0 10.0 0.0% 0 854ms 106 0
MiMo-V2.5 4.6 10.0 0.0% 0 841ms 97 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 9.8 10.0 100.0% 0 1.03s 81 0
MiMo-V2.5 6.5 10.0 50.0% 0 751ms 72 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 3.3 10.0 0.0% 0 849ms 170 0
MiMo-V2.5 3.4 10.0 0.0% 0 731ms 162 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 3.0 10.0 0.0% 0 2.79s 230 0
MiMo-V2.5 10.0 10.0 100.0% 0 2.43s 231 0

त्वरित तुलना

तुलना जोड़ी बदलें