नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

MoonshotAI: Kimi K2.5 vs Elephant

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-14

मेट्रिक Kimi K2.5 Kimi K2.5 none रिलीज़: 2026-01-27 Elephant Elephant medium रिलीज़: 2026-04-14
स्कोर 5.5 5.2
रैंक #72 #77
संगति 8.7 9.6
सही परीक्षण
प्रति प्रयास पास दर 40.7% 29.6%
अस्थिर टेस्ट 3 1
कुल रन 54 54
प्रति परिणाम लागत 0.271 0.000
कुल लागत $0.017 $0.000
???? ??? $0.383 / 1M $0.000 / 1M
????? ??? $1.720 / 1M $0.000 / 1M
आउटपुट टोकन 2,659 2,596
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 13.37s 1.27s
प्रतिक्रिया समय (अधिकतम) 42.13s 3.70s
प्रतिक्रिया समय (कुल) 147.05s 22.82s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 373 0
Elephant 6.6 10.0 50.0% 0 1.19s 815 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 10.0 10.0 100.0% 0 38.78s 649 0
Elephant 5.1 3.3 33.3% 1 1.30s 365 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 748 0
Elephant 3.0 10.0 0.0% 0 3.70s 562 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 187 0
Elephant 6.5 10.0 50.0% 0 979ms 246 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 29 0
Elephant 3.0 10.0 0.0% 0 925ms 24 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
Elephant 4.3 10.0 0.0% 0 920ms 105 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 60 0
Elephant 9.8 10.0 100.0% 0 987ms 82 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 3.1 10.0 0.0% 0 4.73s 317 0
Elephant 3.7 10.0 0.0% 0 867ms 166 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0
Elephant 3.0 10.0 0.0% 0 2.83s 231 0

त्वरित तुलना

तुलना जोड़ी बदलें