नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Cobuddy vs MoonshotAI: Kimi K2.5

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-19

मेट्रिक Cobuddy Cobuddy medium रिलीज़: 2026-05-06 निःशुल्क उपलब्ध Kimi K2.5 Kimi K2.5 none रिलीज़: 2026-01-27
स्कोर 5.8 5.4
रैंक #102 #119
विश्वसनीयता 9.9 10.0
संगति 6.9 8.8
सही परीक्षण
प्रति प्रयास पास दर 54.4% 38.6%
अस्थिर टेस्ट 7 3
कुल रन 57 57
प्रति परिणाम लागत 0.000 0.273
कुल लागत $0.000 $0.017
???? ??? $0.000 / 1M $0.400 / 1M
????? ??? $0.000 / 1M $1.900 / 1M
आउटपुट टोकन 1,648 2,679
रीजनिंग टोकन 96,062 0
प्रतिक्रिया समय (औसत) 36.50s 12.58s
प्रतिक्रिया समय (अधिकतम) 309.02s 42.13s
प्रतिक्रिया समय (कुल) 693.45s 150.95s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Cobuddy 8.7 7.9 91.7% 1 10.00s 98 4,666
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 373 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Cobuddy 4.3 1.1 66.7% 1 53.59s 343 9,678
Kimi K2.5 10.0 10.0 100.0% 0 38.78s 649 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Cobuddy 3.0 10.0 0.0% 0 47.38s 465 7,265
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 748 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Cobuddy 6.3 5.8 66.7% 1 17.36s 275 5,591
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 187 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Cobuddy 2.9 4.4 22.2% 2 128.15s 10 49,454
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 29 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Cobuddy 4.2 9.9 0.0% 0 23.23s 76 3,782
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Cobuddy 9.8 10.0 100.0% 0 11.60s 64 2,842
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 60 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Cobuddy 3.5 4.4 33.3% 2 12.91s 175 5,627
Kimi K2.5 3.0 10.0 0.0% 0 4.73s 317 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Cobuddy 10.0 10.0 100.0% 0 11.19s 133 294
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Cobuddy 3.0 10.0 0.0% 0 36.98s 9 6,863
Kimi K2.5 3.0 10.0 0.0% 0 3.90s 20 0

त्वरित तुलना

तुलना जोड़ी बदलें