AI BENCHY
तुलना करें
❤️ Made by XCS
Your ad here

मॉडल नाम

MoonshotAI: Kimi K2.5

बिना तर्क

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए: : 24 फ़र॰ 2026

मेट्रिक MoonshotAI: Kimi K2.5
रैंक#24
कंपनीMoonshotAI
Score 3.62
संगति 8.84
प्रति परिणाम लागत 0.2413
कुल लागत $0.00725
सही परीक्षण
प्रति प्रयास पास दर 30.8%
अस्थिर टेस्ट 2
आउटपुट टोकन 1,695
रीजनिंग टोकन 0
प्रतिक्रिया समय (औसत)11378ms
प्रतिक्रिया समय (कुल)11378ms
प्रतिक्रिया समय (अधिकतम)11378ms

श्रेणी विवरण

श्रेणी पूरी तरह पास टेस्ट Score संगति प्रति प्रयास पास दर अस्थिर टेस्ट तर्क स्कोर प्रतिक्रिया समय (औसत) लागत
एंटी-एआई ट्रिक्स 2.67 7.86 11.1% 1 - 11378ms $0.00121
डेटा पार्सिंग और निष्कर्षण 5.50 5.81 83.3% 1 - 0ms $0.00455
डोमेन-विशिष्ट 4.00 10.00 33.3% 0 - 0ms $0.00027
निर्देश पालन 5.00 9.99 50.0% 0 - 0ms $0.00035
Puzzle Solving 2.00 9.92 0.0% 0 - 0ms $0.00090

तुलना किए गए मॉडल

MoonshotAI: Kimi K2.5 की तुलना इससे करें...

#23 · Z.ai

Z.ai: GLM 4.7 Flash

तर्क (medium)

Score: 3.69

संगति: 6.15

प्रति प्रयास पास दर: 48.7%

अस्थिर टेस्ट: 6

प्रति परिणाम लागत: 0.2600

सही परीक्षण:

कुल लागत: $0.01041

तुलना करें

#25 · X Ai

xAI: Grok 4.1 Fast

बिना तर्क

Score: 3.15

संगति: 9.24

प्रति प्रयास पास दर: 28.2%

अस्थिर टेस्ट: 1

प्रति परिणाम लागत: 0.1153

सही परीक्षण:

कुल लागत: $0.00346

तुलना करें

#22 · Xiaomi

Xiaomi: MiMo-V2-Flash

तर्क (medium)

Score: 3.77

संगति: 7.46

प्रति प्रयास पास दर: 43.6%

अस्थिर टेस्ट: 4

प्रति परिणाम लागत: 0.5072

सही परीक्षण:

कुल लागत: $0.02029

तुलना करें

त्वरित तुलना

MoonshotAI: Kimi K2.5 की तुलना इससे करें...