नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs MoonshotAI: Kimi K2.6

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-19

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium प्रकाशन: 2026-02-05 Kimi K2.6 Kimi K2.6 medium प्रकाशन: 2026-04-20
स्कोअर 7.4 7.6
क्रमांक #57 #47
विश्वसनीयता 10.0 10.0
सुसंगतता 9.1 8.7
बरोबर चाचण्या
प्रति प्रयत्न पास दर 66.7% 71.9%
अस्थिर चाचण्या 2 3
एकूण रन 57 57
प्रति निकाल खर्च 14.243 6.476
एकूण खर्च $1.710 $0.778
???? ??? $5.000 / 1M $0.730 / 1M
????? ??? $25.000 / 1M $3.490 / 1M
आउटपुट टोकन्स 37,874 96,469
रिझनिंग टोकन्स 21,390 195,991
प्रतिसाद वेळ (सरासरी) 24.59s 49.92s
प्रतिसाद वेळ (कमाल) 83.40s 215.85s
प्रतिसाद वेळ (एकूण) 295.08s 898.64s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
Kimi K2.6 7.0 8.0 66.7% 1 11.59s 7,115 8,934
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
Kimi K2.6 10.0 10.0 100.0% 0 106.96s 3,236 18,817
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
Kimi K2.6 10.0 10.0 100.0% 0 40.96s 711 13,876
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
Kimi K2.6 10.0 10.0 100.0% 0 20.38s 316 11,305
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
Kimi K2.6 5.3 7.2 44.4% 1 202.38s 47,035 98,262
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
Kimi K2.6 10.0 10.0 100.0% 0 17.83s 3,981 4,472
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
Kimi K2.6 10.0 10.0 100.0% 0 12.53s 3,977 5,269
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
Kimi K2.6 6.0 7.4 55.6% 1 25.59s 14,140 17,868
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
Kimi K2.6 10.0 10.0 100.0% 0 8.92s 248 1,011
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.6 3.0 10.0 0.0% 0 63.24s 8,045 2,452
Kimi K2.6 3.0 10.0 0.0% 0 130.27s 15,710 16,177

झटपट तुलना

तुलना जोडी बदला