AI BENCHY Compare
Inception: Mercury 2 vs MoonshotAI: Kimi K2.5
AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-03
| मेट्रिक | Mercury 2 Mercury 2 medium | Kimi K2.5 Kimi K2.5 medium |
|---|---|---|
| स्कोअर | 6.5 | 6.7 |
| क्रमांक | #89 | #81 |
| विश्वसनीयता | 10.0 | 10.0 |
| सुसंगतता | 8.8 | 6.8 |
| बरोबर चाचण्या | ||
| प्रति प्रयत्न पास दर | 51.7% | 66.7% |
| अस्थिर चाचण्या | 3 | 8 |
| एकूण रन | 60 | 60 |
| प्रति निकाल खर्च | 0.611 | 3.486 |
| एकूण खर्च | $0.055 | $0.272 |
| इनपुट किंमत | $0.250 / 1M | $0.400 / 1M |
| आउटपुट किंमत | $0.750 / 1M | $1.900 / 1M |
| एकूण इनपुट टोकन्स | 32,570 | 31,717 |
| आउटपुट टोकन्स | 4,022 | 48,374 |
| रिझनिंग टोकन्स | 58,405 | 128,473 |
| प्रतिसाद वेळ (सरासरी) | 2.27s | 89.02s |
| प्रतिसाद वेळ (कमाल) | 14.63s | 281.00s |
| प्रतिसाद वेळ (एकूण) | 43.20s | 1157.32s |
स्कोअर विरुद्ध एकूण खर्च
प्रतिसाद वेळ (सरासरी)
स्कोअर vs प्रतिसाद वेळ (सरासरी)
एकूण आउटपुट टोकन्स
स्कोअर vs एकूण आउटपुट टोकन्स
श्रेणीवार तपशील
झटपट तुलना
तुलना जोडी बदला
Gemini 3.1 Flash LiteminimalvsKimi K2.5mediumGemma 4 31Bnoneमोफत उपलब्धvsKimi K2.5mediumMercury 2mediumvsGPT-5.5noneGemini 3.1 Flash LitenonevsMercury 2mediumKimi K2.5mediumvsQwen3.7 PlusnoneMercury 2mediumvsQwen3.7 PlusnoneMercury 2mediumvsQwen3.5 Plus 2026-02-15noneMercury 2mediumvsRing-2.6-1TnoneGemini 3.1 Flash LitenonevsKimi K2.5mediumKimi K2.5mediumvsGPT-5.5noneGemini 2.5 FlashnonevsMercury 2mediumGemini 3.1 Flash LiteminimalvsMercury 2medium