AI BENCHY तुलना
Inception: Mercury 2 vs MoonshotAI: Kimi K2.5
बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-03
| मेट्रिक | Mercury 2 Mercury 2 medium | Kimi K2.5 Kimi K2.5 medium |
|---|---|---|
| स्कोर | 6.5 | 6.7 |
| रैंक | #89 | #81 |
| विश्वसनीयता | 10.0 | 10.0 |
| संगति | 8.8 | 6.8 |
| सही परीक्षण | ||
| प्रति प्रयास पास दर | 51.7% | 66.7% |
| अस्थिर टेस्ट | 3 | 8 |
| कुल रन | 60 | 60 |
| प्रति परिणाम लागत | 0.611 | 3.486 |
| कुल लागत | $0.055 | $0.272 |
| इनपुट कीमत | $0.250 / 1M | $0.400 / 1M |
| आउटपुट कीमत | $0.750 / 1M | $1.900 / 1M |
| कुल इनपुट टोकन | 32,570 | 31,717 |
| आउटपुट टोकन | 4,022 | 48,374 |
| रीजनिंग टोकन | 58,405 | 128,473 |
| प्रतिक्रिया समय (औसत) | 2.27s | 89.02s |
| प्रतिक्रिया समय (अधिकतम) | 14.63s | 281.00s |
| प्रतिक्रिया समय (कुल) | 43.20s | 1157.32s |
स्कोर बनाम कुल लागत
प्रतिक्रिया समय (औसत)
स्कोर vs प्रतिक्रिया समय (औसत)
कुल आउटपुट टोकन
स्कोर vs कुल आउटपुट टोकन
श्रेणी विवरण
त्वरित तुलना
तुलना जोड़ी बदलें
Gemini 3.1 Flash LiteminimalvsKimi K2.5mediumGemma 4 31Bnoneनिःशुल्क उपलब्धvsKimi K2.5mediumMercury 2mediumvsGPT-5.5noneGemini 3.1 Flash LitenonevsMercury 2mediumKimi K2.5mediumvsQwen3.7 PlusnoneMercury 2mediumvsQwen3.7 PlusnoneMercury 2mediumvsQwen3.5 Plus 2026-02-15noneMercury 2mediumvsRing-2.6-1TnoneGemini 3.1 Flash LitenonevsKimi K2.5mediumKimi K2.5mediumvsGPT-5.5noneGemini 2.5 FlashnonevsMercury 2mediumGemini 3.1 Flash LiteminimalvsMercury 2medium