AI BENCHY
Advertise here
#122

Nemotron 3 Super

NVIDIA रिलीज़: 2026-03-11 परीक्षण किया गया: 2026-05-08 15:31 nvidia/nemotron-3-super-120b-a12b::none
(medium) (none)

सारांश

Nemotron 3 Super AI BENCHY पर 5.2 स्कोर करता है और #122 पर है। इसकी reliability 10.0, pass rate 35.1%, कुल लागत $0.002, और औसत response time 5.80s है।

Nemotron 3 Super को अलग क्या बनाता है: इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है।

संगति

8.7

कुल आउटपुट टोकन

6,145

कुल इनपुट टोकन

0

इनपुट कीमत

$0.090 / 1M

आउटपुट कीमत

$0.450 / 1M

सही परीक्षण

गलत टेस्ट: 14

प्रति प्रयास पास दर: 35.1%

अस्थिर टेस्ट

3

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

5.80s

प्रतिक्रिया समय (अधिकतम): 16.45s

प्रतिक्रिया समय (कुल): 110.20s

रन इतिहास

परीक्षण किया गया स्कोर विश्वसनीयता सही परीक्षण कुल लागत तुलना करें
2026-06-04 13:53 नया टेस्ट जोड़ा गया 4.9 10.0 $0.007 तुलना करें
2026-05-22 00:21 सूट बदला गया 5.0 10.0 $0.002 तुलना करें
2026-05-08 15:31 सूट बदला गया 5.2 10.0 $0.002 वर्तमान रन
2026-04-20 17:48 पहला दर्ज रन 5.1 लागू नहीं $0.000 तुलना करें

इस रन में अलग बेंचमार्क सूट इस्तेमाल हुआ था। ऐतिहासिक बदलाव पढ़ते समय सूट बदलाव को ध्यान में रखें।

रन तुलना

रनस्कोरसंगतिविश्वसनीयतासही परीक्षणअस्थिर टेस्टकुल आउटपुट टोकनकुल इनपुट टोकनकुल लागतप्रतिक्रिया समय (औसत)
2026-05-08 15:31 · सूट बदला गया5.28.710.05/1936,1450$0.0025.80s
2026-04-20 17:48 · पहला दर्ज रन5.18.2लागू नहीं4/1844,7600$0.0008.54s
अंतर+0.1+0.5+1-1+13850+$0.002-2738ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

त्वरित तुलना

श्रेणी विवरण

श्रेणी स्कोर संगति सही परीक्षण
एंटी-एआई ट्रिक्स 4.8 10.0
कोडिंग 3.3 1.6
संयुक्त 3.0 10.0
डेटा पार्सिंग और निष्कर्षण 10.0 10.0
डोमेन-विशिष्ट 3.6 7.2
Samanya Buddhimatta 4.6 10.0
निर्देश पालन 6.3 10.0
पहेली समाधान 5.5 10.0
टूल कॉलिंग 4.7 1.6
सामान्य ज्ञान 3.0 10.0

तुलना किए गए मॉडल