नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Opus 4.8 vs MoonshotAI: Kimi K2.6

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-28

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 none रिलीज़: 2026-05-28 Kimi K2.6 Kimi K2.6 medium रिलीज़: 2026-04-20 निःशुल्क उपलब्ध
स्कोर 7.3 7.4
रैंक #63 #58
विश्वसनीयता 10.0 10.0
संगति 9.2 8.3
सही परीक्षण
प्रति प्रयास पास दर 65.0% 70.8%
अस्थिर टेस्ट 2 4
कुल रन 60 60
प्रति परिणाम लागत 4.324 7.621
कुल लागत $0.519 $0.820
इनपुट कीमत $5.000 / 1M $0.730 / 1M
आउटपुट कीमत $25.000 / 1M $3.490 / 1M
आउटपुट टोकन 8,098 102,208
रीजनिंग टोकन 0 229,120
प्रतिक्रिया समय (औसत) 3.51s 54.03s
प्रतिक्रिया समय (अधिकतम) 17.73s 215.85s
प्रतिक्रिया समय (कुल) 70.19s 1026.57s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
Kimi K2.6 7.0 8.0 66.7% 1 11.59s 7,115 8,934
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
Kimi K2.6 6.5 5.3 75.0% 1 118.23s 9,255 52,215
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
Kimi K2.6 10.0 10.0 100.0% 0 40.96s 711 13,876
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
Kimi K2.6 10.0 10.0 100.0% 0 20.38s 316 11,305
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
Kimi K2.6 5.3 7.2 44.4% 1 202.38s 47,035 98,262
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
Kimi K2.6 10.0 10.0 100.0% 0 17.83s 3,981 4,472
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
Kimi K2.6 10.0 10.0 100.0% 0 12.53s 3,977 5,269
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
Kimi K2.6 6.0 7.4 55.6% 1 25.06s 13,860 17,599
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
Kimi K2.6 10.0 10.0 100.0% 0 8.92s 248 1,011
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
Kimi K2.6 3.0 10.0 0.0% 0 130.27s 15,710 16,177

त्वरित तुलना

तुलना जोड़ी बदलें