नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs Nemotron 3 Super 120b A12b

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-12

मेट्रिक Mercury 2 Mercury 2 none प्रकाशन: 2026-02-24 Nemotron 3 Super 120b A12b Nemotron 3 Super 120b A12b none प्रकाशन: 2026-03-11 मोफत उपलब्ध
क्रमांक #61 #59
सरासरी स्कोअर 3.4 3.4
सुसंगतता 9.0 8.6
प्रति निकाल खर्च 0.153 0.000
एकूण खर्च $0.007 $0.000
बरोबर चाचण्या
प्रति प्रयत्न पास दर 31.3% 31.3%
अस्थिर चाचण्या 2 3
एकूण रन 48 48
आउटपुट टोकन्स 1,303 4,222
रिझनिंग टोकन्स 0 0
प्रतिसाद वेळ (सरासरी) 596ms 8.90s
प्रतिसाद वेळ (कमाल) 1.27s 24.97s
प्रतिसाद वेळ (एकूण) 9.54s 142.40s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

सरासरी स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 10.0 10.0 0.0% 0 466ms 274 0
Nemotron 3 Super 120b A12b 10.0 10.0 0.0% 0 7.14s 2,171 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 10.0 10.0 0.0% 0 606ms 131 0
Nemotron 3 Super 120b A12b 10.0 10.0 0.0% 0 19.98s 124 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 5.5 5.9 83.3% 1 667ms 180 0
Nemotron 3 Super 120b A12b 9.9 10.0 100.0% 0 7.92s 249 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 4.0 7.2 44.4% 1 534ms 46 0
Nemotron 3 Super 120b A12b 10.0 7.2 22.2% 1 6.23s 26 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 4.0 10.0 0.0% 0 628ms 159 0
Nemotron 3 Super 120b A12b 3.0 9.9 0.0% 0 24.97s 170 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 5.5 10.0 50.0% 0 551ms 82 0
Nemotron 3 Super 120b A12b 4.5 6.9 33.3% 1 1.50s 66 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 10.0 10.0 0.0% 0 533ms 234 0
Nemotron 3 Super 120b A12b 4.7 10.0 33.3% 0 7.50s 1,135 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
Nemotron 3 Super 120b A12b 10.0 1.6 66.7% 1 16.00s 281 0

झटपट तुलना

तुलना जोडी बदला