नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

MoonshotAI: Kimi K2.5 vs Hunter Alpha

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-12

मेट्रिक Kimi K2.5 Kimi K2.5 medium रिलीज़: 2026-01-27 Hunter Alpha Hunter Alpha none रिलीज़: रिलीज़ तिथि अज्ञात
रैंक #30 #50
औसत स्कोर 6.4 4.6
संगति 7.5 8.0
प्रति परिणाम लागत 2.171 0.000
कुल लागत $0.196 $0.000
सही परीक्षण
प्रति प्रयास पास दर 72.9% 52.1%
अस्थिर टेस्ट 5 4
कुल रन 48 48
आउटपुट टोकन 38,453 2,272
रीजनिंग टोकन 72,496 0
प्रतिक्रिया समय (औसत) 69.83s 4.64s
प्रतिक्रिया समय (अधिकतम) 137.29s 15.17s
प्रतिक्रिया समय (कुल) 628.45s 74.24s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

औसत स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 7.0 7.2 88.9% 1 85.28s 335 6,255
Hunter Alpha 1.3 7.4 22.2% 1 3.85s 773 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 703 3,713
Hunter Alpha 10.0 10.0 0.0% 0 15.17s 379 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 9.9 10.0 100.0% 0 49.78s 563 7,940
Hunter Alpha 9.9 10.0 100.0% 0 8.49s 249 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 10.0 4.4 33.3% 2 137.29s 20,753 30,564
Hunter Alpha 4.0 10.0 33.3% 0 2.33s 27 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 6.0 3.4 66.7% 1 69.73s 3,815 4,262
Hunter Alpha 5.0 3.1 66.7% 1 2.71s 91 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 5,371 6,547
Hunter Alpha 5.0 10.0 50.0% 0 2.82s 69 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 4.0 7.3 44.4% 1 45.40s 6,671 12,403
Hunter Alpha 4.0 4.4 66.7% 2 3.06s 349 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 242 812
Hunter Alpha 10.0 10.0 100.0% 0 6.02s 335 0

त्वरित तुलना

तुलना जोड़ी बदलें