नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Inception: Mercury 2 vs Qwen: Qwen3.6 Flash

सारांश

Mercury 2 vs Qwen3.6 Flash benchmark तुलना: Qwen3.6 Flash average score मध्ये पुढे आहे: 6.0 vs 4.6. Mercury 2 चा benchmark खर्च कमी आहे: $0.011 vs $0.015. Mercury 2 वेगवान आहे: 653ms vs 1.60s, pass rates 23.8% vs 33.3%.

शिफारस केलेले मॉडेल: Mercury 2 - It offers the best overall trade-off: a competitive score (4.6), lower cost than Qwen3.6 Flash, and balanced response time.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक Mercury 2 Mercury 2 none प्रकाशन: 2026-02-24 Qwen3.6 Flash Qwen3.6 Flash none प्रकाशन: 2026-04-20
स्कोअर 4.6 6.0
क्रमांक #151 #102
विश्वसनीयता 10.0 10.0
सुसंगतता 9.2 10.0
बरोबर चाचण्या
प्रति प्रयत्न पास दर 23.8% 33.3%
अस्थिर चाचण्या 2 0
एकूण रन 63 63
प्रति निकाल खर्च 0.259 0.266
एकूण खर्च $0.011 $0.015
इनपुट किंमत $0.250 / 1M $0.188 / 1M
आउटपुट किंमत $0.750 / 1M $1.125 / 1M
एकूण इनपुट टोकन्स 28,113 50,810
आउटपुट टोकन्स 4,439 4,164
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 653ms 1.60s
प्रतिसाद वेळ (कमाल) 1.43s 4.60s
प्रतिसाद वेळ (एकूण) 13.72s 33.59s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#151 Mercury 2

none
खर्च
$0.002
वेळ
1.8s
टोकन्स
1,514 tok

#102 Qwen3.6 Flash

none
खर्च
$0.005
वेळ
20.1s
टोकन्स
4,211 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 483ms 631 286 0
Qwen3.6 Flash 3.1 10.0 0.0% 0 1.63s 696 1,554 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.4 9.6 0.0% 0 1.03s 7,229 3,088 0
Qwen3.6 Flash 5.4 10.0 33.3% 0 1.79s 6,488 889 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 606ms 4,821 131 0
Qwen3.6 Flash 3.0 10.0 0.0% 0 4.22s 24,675 315 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 7.3 5.9 83.3% 1 667ms 6,362 180 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 2.13s 7,794 243 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 5.3 7.2 44.4% 1 534ms 784 46 0
Qwen3.6 Flash 5.3 10.0 33.3% 0 1.11s 789 15 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 4.8 10.0 0.0% 0 628ms 495 159 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 947ms 522 132 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 6.5 10.0 50.0% 0 551ms 691 82 0
Qwen3.6 Flash 6.3 10.0 50.0% 0 1.10s 711 66 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.1 10.0 0.0% 0 535ms 694 251 0
Qwen3.6 Flash 3.5 10.0 0.0% 0 1.21s 714 669 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 10.0 10.0 100.0% 0 1.27s 6,193 197 0
Qwen3.6 Flash 10.0 10.0 100.0% 0 2.49s 8,211 272 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 548ms 213 19 0
Qwen3.6 Flash 3.0 10.0 0.0% 0 649ms 210 9 0

झटपट तुलना

तुलना जोडी बदला