नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs xAI: Grok 4.20

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-22

मेट्रिक Kimi K2.5 Kimi K2.5 none प्रकाशन: 2026-01-27 Grok 4.20 Grok 4.20 none प्रकाशन: 2026-03-31
स्कोअर 5.3 5.4
क्रमांक #126 #120
विश्वसनीयता 10.0 लागू नाही
सुसंगतता 8.9 9.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर 36.7% 35.2%
अस्थिर चाचण्या 3 1
एकूण रन 60 54
प्रति निकाल खर्च 0.428 1.574
एकूण खर्च $0.026 $0.095
???? ??? $0.400 / 1M $1.250 / 1M
????? ??? $1.900 / 1M $2.500 / 1M
आउटपुट टोकन्स 6,734 1,967
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 14.16s 1.11s
प्रतिसाद वेळ (कमाल) 42.13s 6.04s
प्रतिसाद वेळ (एकूण) 184.10s 20.02s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 3.6 8.4 8.3% 1 6.24s 373 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 267 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 6.8 10.0 50.0% 0 35.97s 4,704 0
Grok 4.20 3.4 9.3 0.0% 0 1.22s 312 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 2.8 2.1 33.3% 1 19.16s 748 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 282 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 7.3 5.8 83.3% 1 42.13s 187 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 207 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 5.3 10.0 33.3% 0 4.38s 29 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 325 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 83 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 6.5 10.0 50.0% 0 2.67s 60 0
Grok 4.20 6.3 10.0 50.0% 0 455ms 60 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 3.0 10.0 0.0% 0 4.73s 317 0
Grok 4.20 5.3 7.2 44.4% 1 487ms 242 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 189 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Kimi K2.5 3.0 10.0 0.0% 0 3.90s 20 0
Grok 4.20 - - - - - - - -

झटपट तुलना

तुलना जोडी बदला