नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Nemotron 3 Super 120b A12b vs OpenAI: GPT-5.4

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-03-12

मेट्रिक Nemotron 3 Super 120b A12b Nemotron 3 Super 120b A12b medium प्रकाशन: 2026-03-11 मोफत उपलब्ध GPT-5.4 GPT-5.4 none प्रकाशन: 2026-03-05
क्रमांक #36 #51
सरासरी स्कोअर 5.8 4.5
सुसंगतता 8.5 8.9
प्रति निकाल खर्च 0.000 1.562
एकूण खर्च $0.000 $0.094
बरोबर चाचण्या
प्रति प्रयत्न पास दर 56.3% 41.7%
अस्थिर चाचण्या 3 2
एकूण रन 48 48
आउटपुट टोकन्स 11,925 1,819
रिझनिंग टोकन्स 29,687 0
प्रतिसाद वेळ (सरासरी) 20.24s 1.48s
प्रतिसाद वेळ (कमाल) 87.80s 2.89s
प्रतिसाद वेळ (एकूण) 303.60s 23.64s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

सरासरी स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

सरासरी स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 12.96s 1,754 3,264
GPT-5.4 10.0 7.3 11.1% 1 1.41s 388 0
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 87.80s 2,021 9,996
GPT-5.4 10.0 10.0 0.0% 0 2.89s 291 0
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Nemotron 3 Super 120b A12b 9.9 10.0 100.0% 0 18.16s 877 2,607
GPT-5.4 9.9 10.0 100.0% 0 1.04s 222 0
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Nemotron 3 Super 120b A12b 10.0 4.4 22.2% 2 16.19s 5,255 6,072
GPT-5.4 4.0 7.2 44.4% 1 1.07s 50 0
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Nemotron 3 Super 120b A12b 2.0 9.9 0.0% 0 27.86s 104 1,149
GPT-5.4 3.0 9.9 0.0% 0 1.78s 184 0
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Nemotron 3 Super 120b A12b 7.0 6.5 66.7% 1 7.72s 1,042 2,479
GPT-5.4 5.5 10.0 50.0% 0 1.07s 81 0
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Nemotron 3 Super 120b A12b 1.3 9.8 0.0% 0 8.39s 602 2,151
GPT-5.4 4.0 9.8 33.3% 0 1.52s 357 0
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 39.75s 270 1,969
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0

झटपट तुलना

तुलना जोडी बदला