AI BENCHY तुलना
MoonshotAI: Kimi K2.5 vs OpenAI: GPT-5.2
बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-19
| मेट्रिक | Kimi K2.5 Kimi K2.5 medium | GPT-5.2 GPT-5.2 medium |
|---|---|---|
| स्कोर | 6.8 | 7.2 |
| रैंक | #76 | #65 |
| विश्वसनीयता | 10.0 | 10.0 |
| संगति | 7.0 | 8.2 |
| सही परीक्षण | ||
| प्रति प्रयास पास दर | 68.4% | 68.4% |
| अस्थिर टेस्ट | 7 | 4 |
| कुल रन | 57 | 57 |
| प्रति परिणाम लागत | 2.616 | 3.609 |
| कुल लागत | $0.236 | $0.397 |
| ???? ??? | $0.400 / 1M | $1.750 / 1M |
| ????? ??? | $1.900 / 1M | $14.000 / 1M |
| आउटपुट टोकन | 42,188 | 2,731 |
| रीजनिंग टोकन | 92,514 | 22,200 |
| प्रतिक्रिया समय (औसत) | 73.39s | 15.22s |
| प्रतिक्रिया समय (अधिकतम) | 150.77s | 77.80s |
| प्रतिक्रिया समय (कुल) | 880.65s | 182.59s |
स्कोर बनाम कुल लागत
प्रतिक्रिया समय (औसत)
स्कोर vs प्रतिक्रिया समय (औसत)
कुल आउटपुट टोकन
स्कोर vs कुल आउटपुट टोकन
श्रेणी विवरण
त्वरित तुलना
तुलना जोड़ी बदलें
Gemini 3.1 Flash LiteminimalvsKimi K2.5mediumClaude Sonnet 4.6nonevsGPT-5.2mediumRing-2.6-1TnonevsGPT-5.2mediumGPT-5.2mediumvsQwen3.6 Max PreviewnoneDeepSeek V4 ProhighvsKimi K2.5mediumGemma 4 31Bnoneनिःशुल्क उपलब्धvsKimi K2.5mediumKimi K2.5mediumvsGPT-5.5noneGemini 3.1 Flash LitenonevsKimi K2.5mediumKimi K2.5mediumvsQwen3.5 Plus 2026-02-15noneGemma 4 31Bnoneनिःशुल्क उपलब्धvsGPT-5.2mediumDeepSeek V4 Flashhighनिःशुल्क उपलब्धvsGPT-5.2mediumDeepSeek V4 ProhighvsGPT-5.2medium