नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Inception: Mercury 2 vs MoonshotAI: Kimi K2.6

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-20

मेट्रिक Mercury 2 Mercury 2 medium रिलीज़: 2026-02-24 Kimi K2.6 Kimi K2.6 none रिलीज़: 2026-04-20
स्कोर 6.5 5.8
रैंक #54 #69
संगति 8.6 9.1
सही परीक्षण
प्रति प्रयास पास दर 53.7% 42.6%
अस्थिर टेस्ट 3 2
कुल रन 54 54
प्रति परिणाम लागत 0.580 0.543
कुल लागत $0.047 $0.038
???? ??? $0.250 / 1M $0.950 / 1M
????? ??? $0.750 / 1M $4.000 / 1M
आउटपुट टोकन 3,972 2,973
रीजनिंग टोकन 48,333 0
प्रतिक्रिया समय (औसत) 2.21s 2.05s
प्रतिक्रिया समय (अधिकतम) 14.63s 6.65s
प्रतिक्रिया समय (कुल) 37.51s 36.93s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
Kimi K2.6 4.6 10.0 25.0% 0 1.39s 471 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.53s 249 2,213
Kimi K2.6 10.0 10.0 100.0% 0 6.65s 1,176 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
Kimi K2.6 3.0 10.0 0.0% 0 3.38s 290 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
Kimi K2.6 10.0 10.0 100.0% 0 1.32s 201 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
Kimi K2.6 5.3 7.2 44.4% 1 1.48s 42 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
Kimi K2.6 5.4 3.5 33.3% 1 1.55s 138 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
Kimi K2.6 6.5 10.0 50.0% 0 1.64s 72 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 3.9 7.5 22.2% 1 934ms 354 2,758
Kimi K2.6 3.4 9.7 0.0% 0 1.66s 343 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956
Kimi K2.6 10.0 10.0 100.0% 0 4.46s 240 0

त्वरित तुलना

तुलना जोड़ी बदलें