AI BENCHY
तुलना करा
❤️ Made by XCS

मॉडेल नाव

MoonshotAI: Kimi K2.5

Aibenchy टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले : १९ फेब्रु, २०२६

मेट्रिक MoonshotAI: Kimi K2.5
क्रमांक#9
कंपनीMoonshotAI
Score 6.42
सुसंगतता 8.00
प्रति निकाल खर्च 2.4097
एकूण खर्च $0.16868
बरोबर चाचण्या 7/12
प्रति प्रयत्न पास दर 72.2%
अस्थिर चाचण्या 3
आउटपुट टोकन्स 30,235
रिझनिंग टोकन्स 53,179

श्रेणीवार तपशील

श्रेणी पूर्णपणे पास झालेल्या चाचण्या Score सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या तर्क गुण खर्च
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 9.77 $0.00634
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.67 $0.02325
Domain specific 0/3 1.00 4.41 33.3% 2 7.22 $0.09579
Instructions following 2/2 9.50 10.00 100.0% 0 9.42 $0.01428
Puzzle Solving 1/3 5.00 7.61 55.6% 1 9.26 $0.02904

तुलना केलेली मॉडेल्स

MoonshotAI: Kimi K2.5 ची तुलना याच्याशी करा...

#8 · X Ai

xAI: Grok 4.1 Fast

तर्क (medium)

Score: 6.42

सुसंगतता: 8.60

प्रति प्रयत्न पास दर: 66.7%

अस्थिर चाचण्या: 2

प्रति निकाल खर्च: 0.4800

बरोबर चाचण्या: 7/12

एकूण खर्च: $0.03360

तुलना करा

#10 · Google

Google: Gemini 3 Flash Preview

तर्क नाही

Score: 6.25

सुसंगतता: 8.60

प्रति प्रयत्न पास दर: 66.7%

अस्थिर चाचण्या: 2

प्रति निकाल खर्च: 0.0754

बरोबर चाचण्या: 7/12

एकूण खर्च: $0.00528

तुलना करा

#7 · Z.ai

Z.ai: GLM 5

तर्क (medium)

Score: 6.83

सुसंगतता: 7.86

प्रति प्रयत्न पास दर: 80.6%

अस्थिर चाचण्या: 3

प्रति निकाल खर्च: 1.3424

बरोबर चाचण्या: 8/12

एकूण खर्च: $0.10740

तुलना करा

झटपट तुलना

MoonshotAI: Kimi K2.5 ची तुलना याच्याशी करा...