नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Inception: Mercury 2 vs OpenAI: gpt-oss-120b

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-16

मेट्रिक Mercury 2 Mercury 2 none प्रकाशन: 2026-02-24 gpt-oss-120b gpt-oss-120b none प्रकाशन: 2025-08-05 मोफत उपलब्ध
स्कोअर 4.8 5.2
क्रमांक #89 #82
सुसंगतता 9.0 7.9
बरोबर चाचण्या
प्रति प्रयत्न पास दर 27.8% 38.9%
अस्थिर चाचण्या 2 5
एकूण रन 54 54
प्रति निकाल खर्च 0.165 0.221
एकूण खर्च $0.007 $0.009
???? ??? $0.250 / 1M $0.039 / 1M
????? ??? $0.750 / 1M $0.190 / 1M
आउटपुट टोकन्स 1,625 44,652
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 613ms 11.96s
प्रतिसाद वेळ (कमाल) 1.27s 68.97s
प्रतिसाद वेळ (एकूण) 11.04s 179.34s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 483ms 286 0
gpt-oss-120b 6.6 8.0 58.3% 1 6.03s 4,867 0
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.6 8.9 0.0% 0 969ms 310 0
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.0 10.0 0.0% 0 606ms 131 0
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 7.3 5.9 83.3% 1 667ms 180 0
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 5.3 7.2 44.4% 1 534ms 46 0
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 4.8 10.0 0.0% 0 628ms 159 0
gpt-oss-120b 4.6 10.0 0.0% 0 2.83s 586 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 6.5 10.0 50.0% 0 551ms 82 0
gpt-oss-120b 8.4 6.9 83.3% 1 5.10s 1,982 0
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 3.1 10.0 0.0% 0 533ms 234 0
gpt-oss-120b 4.5 4.8 44.5% 2 6.86s 3,904 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0

झटपट तुलना

तुलना जोडी बदला