नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Inception: Mercury 2 vs MoonshotAI: Kimi K2.6

सारांश

Mercury 2 vs Kimi K2.6 benchmark तुलना: Kimi K2.6 average score मध्ये पुढे आहे: 5.8 vs 4.6. Mercury 2 चा benchmark खर्च कमी आहे: $0.011 vs $0.079. Mercury 2 वेगवान आहे: 653ms vs 13.27s, pass rates 23.8% vs 36.5%.

शिफारस केलेले मॉडेल: Mercury 2 - It offers the best overall trade-off: a competitive score (4.6), lower cost than Kimi K2.6, and balanced response time.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक Mercury 2 Mercury 2 none प्रकाशन: 2026-02-24 Kimi K2.6 Kimi K2.6 none प्रकाशन: 2026-04-20 मोफत उपलब्ध
स्कोअर 4.6 5.8
क्रमांक #151 #111
विश्वसनीयता 10.0 10.0
सुसंगतता 9.2 9.2
बरोबर चाचण्या
प्रति प्रयत्न पास दर 23.8% 36.5%
अस्थिर चाचण्या 2 2
एकूण रन 63 63
प्रति निकाल खर्च 0.259 1.267
एकूण खर्च $0.011 $0.079
इनपुट किंमत $0.250 / 1M $0.680 / 1M
आउटपुट किंमत $0.750 / 1M $3.410 / 1M
एकूण इनपुट टोकन्स 28,113 32,916
आउटपुट टोकन्स 4,439 16,410
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 653ms 13.27s
प्रतिसाद वेळ (कमाल) 1.43s 238.89s
प्रतिसाद वेळ (एकूण) 13.72s 278.57s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#151 Mercury 2

none
खर्च
$0.002
वेळ
1.8s
टोकन्स
1,514 tok

#111 MoonshotAI: Kimi K2.6

none
खर्च
$0.020
वेळ
127.4s
टोकन्स
4,429 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 483ms 631 286 0
Kimi K2.6 4.6 10.0 25.0% 0 1.39s 618 471 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.4 9.6 0.0% 0 1.03s 7,229 3,088 0
Kimi K2.6 5.5 9.8 33.3% 0 82.57s 5,986 14,754 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 606ms 4,821 131 0
Kimi K2.6 3.0 10.0 0.0% 0 3.38s 11,269 290 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 7.3 5.9 83.3% 1 667ms 6,362 180 0
Kimi K2.6 10.0 10.0 100.0% 0 1.32s 7,014 201 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 5.3 7.2 44.4% 1 534ms 784 46 0
Kimi K2.6 5.3 7.2 44.4% 1 1.48s 732 42 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 4.8 10.0 0.0% 0 628ms 495 159 0
Kimi K2.6 5.4 3.5 33.3% 1 1.55s 477 138 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 6.5 10.0 50.0% 0 551ms 691 82 0
Kimi K2.6 6.5 10.0 50.0% 0 1.64s 669 72 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.1 10.0 0.0% 0 535ms 694 251 0
Kimi K2.6 3.1 9.9 0.0% 0 1.40s 651 185 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 10.0 10.0 100.0% 0 1.27s 6,193 197 0
Kimi K2.6 10.0 10.0 100.0% 0 4.46s 5,286 240 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 548ms 213 19 0
Kimi K2.6 3.0 10.0 0.0% 0 1.36s 214 17 0

झटपट तुलना

तुलना जोडी बदला