नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Inception: Mercury 2 vs Qwen: Qwen3.5-122B-A10B

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-01

मेट्रिक Mercury 2 Mercury 2 medium प्रकाशन: 2026-02-24 Qwen3.5-122B-A10B Qwen3.5-122B-A10B none प्रकाशन: 2026-02-24
स्कोअर 6.5 5.4
क्रमांक #93 #131
विश्वसनीयता 10.0 10.0
सुसंगतता 8.8 9.5
बरोबर चाचण्या
प्रति प्रयत्न पास दर 51.7% 33.3%
अस्थिर चाचण्या 3 1
एकूण रन 60 60
प्रति निकाल खर्च 0.611 0.380
एकूण खर्च $0.055 $0.019
इनपुट किंमत $0.250 / 1M $0.260 / 1M
आउटपुट किंमत $0.750 / 1M $2.080 / 1M
आउटपुट टोकन्स 4,022 3,374
रिझनिंग टोकन्स 58,405 0
प्रतिसाद वेळ (सरासरी) 2.27s 3.38s
प्रतिसाद वेळ (कमाल) 14.63s 46.00s
प्रतिसाद वेळ (एकूण) 43.20s 67.55s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
Qwen3.5-122B-A10B 4.8 10.0 25.0% 0 1.59s 312 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 7.2 6.5 66.7% 1 2.29s 270 8,514
Qwen3.5-122B-A10B 4.0 5.5 33.3% 1 2.14s 684 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 46.00s 1,137 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 1.01s 243 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
Qwen3.5-122B-A10B 5.3 10.0 33.3% 0 465ms 15 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
Qwen3.5-122B-A10B 5.0 10.0 0.0% 0 1.12s 66 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
Qwen3.5-122B-A10B 6.3 10.0 50.0% 0 513ms 69 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 5.4 10.0 33.3% 0 949ms 361 2,781
Qwen3.5-122B-A10B 3.8 10.0 0.0% 0 1.00s 575 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 2.04s 264 0
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 2.58s 22 3,748
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 295ms 9 0

झटपट तुलना

तुलना जोडी बदला