AI BENCHY तुलना
MoonshotAI: Kimi K2.5 vs xAI: Grok 4.20
बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-02
| मेट्रिक | Kimi K2.5 Kimi K2.5 medium | Grok 4.20 Grok 4.20 medium |
|---|---|---|
| स्कोर | 7.2 | 7.1 |
| रैंक | #39 | #40 |
| संगति | 7.2 | 8.2 |
| सही परीक्षण | ||
| प्रति प्रयास पास दर | 72.6% | 66.7% |
| अस्थिर टेस्ट | 6 | 4 |
| कुल रन | 51 | 51 |
| प्रति परिणाम लागत | 2.232 | 7.358 |
| कुल लागत | $0.201 | $0.663 |
| ???? ??? | $0.383 / 1M | $2.000 / 1M |
| ????? ??? | $1.909 / 1M | $6.000 / 1M |
| आउटपुट टोकन | 40,907 | 1,494 |
| रीजनिंग टोकन | 75,121 | 97,078 |
| प्रतिक्रिया समय (औसत) | 64.59s | 9.50s |
| प्रतिक्रिया समय (अधिकतम) | 137.29s | 29.87s |
| प्रतिक्रिया समय (कुल) | 645.93s | 161.54s |
स्कोर बनाम कुल लागत
प्रतिक्रिया समय (औसत)
स्कोर vs प्रतिक्रिया समय (औसत)
कुल आउटपुट टोकन
स्कोर vs कुल आउटपुट टोकन
श्रेणी विवरण
त्वरित तुलना
तुलना जोड़ी बदलें
Claude Sonnet 4.6nonevsKimi K2.5mediumClaude Sonnet 4.6nonevsGrok 4.20mediumQwen3.5 Plus 2026-02-15nonevsGrok 4.20mediumKimi K2.5mediumvsGPT-5.3 ChatnoneGemma 4 31BnonevsGrok 4.20mediumGrok 4.20mediumvsGLM 5noneKimi K2.5mediumvsQwen3.5 Plus 2026-02-15noneGPT-5.3 ChatnonevsGrok 4.20mediumGemma 4 31BnonevsKimi K2.5mediumKimi K2.5mediumvsGLM 5noneKimi K2.5mediumvsGPT-5.2 ChatnoneGemini 3.1 Flash Lite PreviewnonevsKimi K2.5medium