नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Inception: Mercury 2 vs Qwen3.6 Plus Preview

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-16

मेट्रिक Mercury 2 Mercury 2 none प्रकाशन: 2026-02-24 Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium प्रकाशन: 2026-03-30 मोफत उपलब्ध
स्कोअर 4.8 8.5
क्रमांक #89 #9
सुसंगतता 9.0 10.0
बरोबर चाचण्या
प्रति प्रयत्न पास दर 27.8% 76.5%
अस्थिर चाचण्या 2 0
एकूण रन 54 49
प्रति निकाल खर्च 0.165 0.000
एकूण खर्च $0.007 $0.000
???? ??? $0.250 / 1M $0.000 / 1M
????? ??? $0.750 / 1M $0.000 / 1M
आउटपुट टोकन्स 1,625 1,756
रिझनिंग टोकन्स 0 77,213
प्रतिसाद वेळ (सरासरी) 613ms 13.94s
प्रतिसाद वेळ (कमाल) 1.27s 43.55s
प्रतिसाद वेळ (एकूण) 11.04s 237.01s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 483ms 286 0
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 9.90s 207 7,557
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.6 8.9 0.0% 0 969ms 310 0
Qwen3.6 Plus Preview - - - - - - - -
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 606ms 131 0
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 34.95s 452 13,073
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 7.3 5.9 83.3% 1 667ms 180 0
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 14.95s 270 10,706
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 5.3 7.2 44.4% 1 534ms 46 0
Qwen3.6 Plus Preview 3.0 10.0 0.0% 0 22.08s 49 26,895
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 4.8 10.0 0.0% 0 628ms 159 0
Qwen3.6 Plus Preview 5.1 10.0 0.0% 0 27.05s 111 5,232
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 6.5 10.0 50.0% 0 551ms 82 0
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 7.54s 102 5,552
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.1 10.0 0.0% 0 533ms 234 0
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 6.11s 298 6,868
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
Qwen3.6 Plus Preview 10.0 10.0 100.0% 0 5.87s 267 1,330

झटपट तुलना

तुलना जोडी बदला