नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs MoonshotAI: Kimi K2.5

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-29

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 none प्रकाशन: 2026-02-17 Kimi K2.5 Kimi K2.5 medium प्रकाशन: 2026-01-27
स्कोअर 7.0 6.7
क्रमांक #78 #85
विश्वसनीयता 10.0 10.0
सुसंगतता 9.7 6.8
बरोबर चाचण्या
प्रति प्रयत्न पास दर 58.3% 66.7%
अस्थिर चाचण्या 1 8
एकूण रन 60 60
प्रति निकाल खर्च 2.782 3.486
एकूण खर्च $0.306 $0.314
इनपुट किंमत $3.000 / 1M $0.400 / 1M
आउटपुट किंमत $15.000 / 1M $1.900 / 1M
आउटपुट टोकन्स 9,450 48,374
रिझनिंग टोकन्स 0 128,473
प्रतिसाद वेळ (सरासरी) 5.27s 89.02s
प्रतिसाद वेळ (कमाल) 23.84s 281.00s
प्रतिसाद वेळ (एकूण) 68.50s 1157.32s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 1,214 0
Kimi K2.5 7.3 5.8 83.3% 2 51.38s 2,789 8,880
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 6.8 10.0 50.0% 0 6.73s 2,112 0
Kimi K2.5 4.1 1.9 50.0% 2 215.89s 5,700 45,419
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 3,766 0
Kimi K2.5 10.0 10.0 100.0% 0 71.37s 703 3,713
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 252 0
Kimi K2.5 10.0 10.0 100.0% 0 49.78s 563 7,940
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 413 0
Kimi K2.5 3.5 4.4 33.3% 2 137.29s 20,753 30,564
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 192 0
Kimi K2.5 6.5 3.4 66.7% 1 69.73s 3,815 4,262
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 90 0
Kimi K2.5 10.0 10.0 100.0% 0 92.47s 5,371 6,547
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 533 0
Kimi K2.5 5.3 7.3 44.4% 1 43.23s 8,426 12,692
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 447 0
Kimi K2.5 10.0 10.0 100.0% 0 31.74s 242 812
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 431 0
Kimi K2.5 3.0 10.0 0.0% 0 83.95s 12 7,644

झटपट तुलना

तुलना जोडी बदला