AI BENCHY Compare
MoonshotAI: Kimi K2.5 vs OpenAI: GPT-5.2
AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-05-19
| मेट्रिक | Kimi K2.5 Kimi K2.5 medium | GPT-5.2 GPT-5.2 medium |
|---|---|---|
| स्कोअर | 6.8 | 7.2 |
| क्रमांक | #76 | #65 |
| विश्वसनीयता | 10.0 | 10.0 |
| सुसंगतता | 7.0 | 8.2 |
| बरोबर चाचण्या | ||
| प्रति प्रयत्न पास दर | 68.4% | 68.4% |
| अस्थिर चाचण्या | 7 | 4 |
| एकूण रन | 57 | 57 |
| प्रति निकाल खर्च | 2.616 | 3.609 |
| एकूण खर्च | $0.236 | $0.397 |
| ???? ??? | $0.400 / 1M | $1.750 / 1M |
| ????? ??? | $1.900 / 1M | $14.000 / 1M |
| आउटपुट टोकन्स | 42,188 | 2,731 |
| रिझनिंग टोकन्स | 92,514 | 22,200 |
| प्रतिसाद वेळ (सरासरी) | 73.39s | 15.22s |
| प्रतिसाद वेळ (कमाल) | 150.77s | 77.80s |
| प्रतिसाद वेळ (एकूण) | 880.65s | 182.59s |
स्कोअर विरुद्ध एकूण खर्च
प्रतिसाद वेळ (सरासरी)
स्कोअर vs प्रतिसाद वेळ (सरासरी)
एकूण आउटपुट टोकन्स
स्कोअर vs एकूण आउटपुट टोकन्स
श्रेणीवार तपशील
झटपट तुलना
तुलना जोडी बदला
Gemini 3.1 Flash LiteminimalvsKimi K2.5mediumClaude Sonnet 4.6nonevsGPT-5.2mediumRing-2.6-1TnonevsGPT-5.2mediumGPT-5.2mediumvsQwen3.6 Max PreviewnoneDeepSeek V4 ProhighvsKimi K2.5mediumGemma 4 31Bnoneमोफत उपलब्धvsKimi K2.5mediumKimi K2.5mediumvsGPT-5.5noneGemini 3.1 Flash LitenonevsKimi K2.5mediumKimi K2.5mediumvsQwen3.5 Plus 2026-02-15noneGemma 4 31Bnoneमोफत उपलब्धvsGPT-5.2mediumDeepSeek V4 Flashhighमोफत उपलब्धvsGPT-5.2mediumDeepSeek V4 ProhighvsGPT-5.2medium