नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Nemotron 3 Super 120b A12b vs OpenAI: gpt-oss-120b

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-12

मेट्रिक Nemotron 3 Super 120b A12b Nemotron 3 Super 120b A12b none प्रकाशन: 2026-03-11 मोफत उपलब्ध gpt-oss-120b gpt-oss-120b medium प्रकाशन: 2025-08-05 मोफत उपलब्ध
क्रमांक #59 #43
सरासरी स्कोअर 3.4 5.1
सुसंगतता 8.6 7.4
प्रति निकाल खर्च 0.000 0.135
एकूण खर्च $0.000 $0.010
बरोबर चाचण्या
प्रति प्रयत्न पास दर 31.3% 54.2%
अस्थिर चाचण्या 3 5
एकूण रन 48 48
आउटपुट टोकन्स 4,222 13,210
रिझनिंग टोकन्स 0 34,230
प्रतिसाद वेळ (सरासरी) 8.90s 16.65s
प्रतिसाद वेळ (कमाल) 24.97s 50.92s
प्रतिसाद वेळ (एकूण) 142.40s 149.88s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

सरासरी स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Nemotron 3 Super 120b A12b 10.0 10.0 0.0% 0 7.14s 2,171 0
gpt-oss-120b 7.0 9.8 66.7% 0 19.76s 3,463 2,077
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Nemotron 3 Super 120b A12b 10.0 10.0 0.0% 0 19.98s 124 0
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Nemotron 3 Super 120b A12b 9.9 10.0 100.0% 0 7.92s 249 0
gpt-oss-120b 5.5 5.9 66.7% 1 1.98s 241 1,114
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Nemotron 3 Super 120b A12b 10.0 7.2 22.2% 1 6.23s 26 0
gpt-oss-120b 10.0 4.4 22.2% 2 50.92s 6,784 20,606
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Nemotron 3 Super 120b A12b 3.0 9.9 0.0% 0 24.97s 170 0
gpt-oss-120b 3.0 10.0 0.0% 0 7.90s 107 387
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Nemotron 3 Super 120b A12b 4.5 6.9 33.3% 1 1.50s 66 0
gpt-oss-120b 9.5 10.0 100.0% 0 7.63s 126 1,799
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Nemotron 3 Super 120b A12b 4.7 10.0 33.3% 0 7.50s 1,135 0
gpt-oss-120b 1.7 4.7 22.2% 2 11.80s 1,508 2,092
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Nemotron 3 Super 120b A12b 10.0 1.6 66.7% 1 16.00s 281 0
gpt-oss-120b 9.0 10.0 100.0% 0 6.91s 287 1,083

झटपट तुलना

तुलना जोडी बदला