नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Opus 4.6 vs MoonshotAI: Kimi K2.6

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-19

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium रिलीज़: 2026-02-05 Kimi K2.6 Kimi K2.6 medium रिलीज़: 2026-04-20
स्कोर 7.4 7.6
रैंक #57 #47
विश्वसनीयता 10.0 10.0
संगति 9.1 8.7
सही परीक्षण
प्रति प्रयास पास दर 66.7% 71.9%
अस्थिर टेस्ट 2 3
कुल रन 57 57
प्रति परिणाम लागत 14.243 6.476
कुल लागत $1.710 $0.778
???? ??? $5.000 / 1M $0.730 / 1M
????? ??? $25.000 / 1M $3.490 / 1M
आउटपुट टोकन 37,874 96,469
रीजनिंग टोकन 21,390 195,991
प्रतिक्रिया समय (औसत) 24.59s 49.92s
प्रतिक्रिया समय (अधिकतम) 83.40s 215.85s
प्रतिक्रिया समय (कुल) 295.08s 898.64s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
Kimi K2.6 7.0 8.0 66.7% 1 11.59s 7,115 8,934
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
Kimi K2.6 10.0 10.0 100.0% 0 106.96s 3,236 18,817
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
Kimi K2.6 10.0 10.0 100.0% 0 40.96s 711 13,876
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
Kimi K2.6 10.0 10.0 100.0% 0 20.38s 316 11,305
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
Kimi K2.6 5.3 7.2 44.4% 1 202.38s 47,035 98,262
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
Kimi K2.6 10.0 10.0 100.0% 0 17.83s 3,981 4,472
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
Kimi K2.6 10.0 10.0 100.0% 0 12.53s 3,977 5,269
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
Kimi K2.6 6.0 7.4 55.6% 1 25.59s 14,140 17,868
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
Kimi K2.6 10.0 10.0 100.0% 0 8.92s 248 1,011
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 3.0 10.0 0.0% 0 63.24s 8,045 2,452
Kimi K2.6 3.0 10.0 0.0% 0 130.27s 15,710 16,177

त्वरित तुलना

तुलना जोड़ी बदलें