नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs Elephant

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-14

मेट्रिक Kimi K2.5 Kimi K2.5 none प्रकाशन: 2026-01-27 Elephant Elephant none प्रकाशन: 2026-04-14
स्कोअर 5.5 5.2
क्रमांक #72 #81
सुसंगतता 8.7 9.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 40.7% 31.5%
अस्थिर चाचण्या 3 1
एकूण रन 54 54
प्रति निकाल खर्च 0.271 0.000
एकूण खर्च $0.017 $0.000
???? ??? $0.383 / 1M $0.000 / 1M
????? ??? $1.720 / 1M $0.000 / 1M
आउटपुट टोकन्स 2,659 2,573
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 13.37s 1.23s
प्रतिसाद वेळ (कमाल) 42.13s 3.81s
प्रतिसाद वेळ (एकूण) 147.05s 22.16s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 373 0
Elephant 6.6 10.0 50.0% 0 963ms 610 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 100.0% 0 38.78s 649 0
Elephant 6.4 3.3 66.7% 1 1.39s 375 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 748 0
Elephant 3.0 10.0 0.0% 0 3.81s 731 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 187 0
Elephant 6.5 10.0 50.0% 0 1.04s 246 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 29 0
Elephant 3.0 10.0 0.0% 0 927ms 24 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
Elephant 4.0 10.0 0.0% 0 854ms 106 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 60 0
Elephant 9.8 10.0 100.0% 0 1.03s 81 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 3.1 10.0 0.0% 0 4.73s 317 0
Elephant 3.3 10.0 0.0% 0 849ms 170 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0
Elephant 3.0 10.0 0.0% 0 2.79s 230 0

झटपट तुलना

तुलना जोडी बदला