#107

Nemotron 3 Nano Omni 30b A3b Reasoning

NVIDIA रिलीज़: 2026-04-28 परीक्षण किया गया: 2026-04-28 23:26 nvidia/nemotron-3-nano-omni-30b-a3b-reasoning::medium

(medium) (none)

सारांश

Nemotron 3 Nano Omni 30b A3b Reasoning AI BENCHY पर 5.2 स्कोर करता है और #107 पर है। इसकी reliability 10.0, pass rate 47.9%, कुल लागत $0.000, और औसत response time 14.46s है।

Nemotron 3 Nano Omni 30b A3b Reasoning को अलग क्या बनाता है: इस score range के लिए इसकी कुल benchmark लागत असामान्य रूप से कम है।

संग्रहीत मॉडल: इस मॉडल को अब अपडेट नहीं किया जाएगा और नए परीक्षणों में टेस्ट नहीं किया जाएगा।

स्कोर

5.2

संगति

5.9

विश्वसनीयता

10.0

कुल लागत (वर्तमान कीमत)

$0.000

कुल आउटपुट टोकन

235,283

कुल इनपुट टोकन

इनपुट कीमत

$0.000 / 1M

आउटपुट कीमत

$0.000 / 1M

सही परीक्षण

गलत टेस्ट: 12

प्रति प्रयास पास दर: 47.9%

अस्थिर टेस्ट

अस्थिर टेस्ट में रनों के बीच मिले-जुले परिणाम रहे (कम से कम एक पास और एक फेल)।

प्रतिक्रिया समय (औसत)

14.46s

प्रतिक्रिया समय (अधिकतम): 147.45s

प्रतिक्रिया समय (कुल): 231.37s

गलत उत्तर: 8 निर्देशों का पालन नहीं किया: 3 कोई उत्तर नहीं: 1

रन इतिहास

परीक्षण किया गया	स्कोर	विश्वसनीयता	सही परीक्षण	कुल लागत	तुलना करें
2026-05-08 15:30 सूट बदला गया	3.4	10.0		$0.000	तुलना करें
2026-04-28 23:26 पहला दर्ज रन	5.2	10.0		$0.000	वर्तमान रन

रन तुलना

रन	स्कोर	संगति	विश्वसनीयता	सही परीक्षण	अस्थिर टेस्ट	कुल आउटपुट टोकन	कुल इनपुट टोकन	कुल लागत	प्रतिक्रिया समय (औसत)
2026-04-28 23:26 · पहला दर्ज रन	5.2	5.9	10.0	4/16	8	235,283	0	$0.000	14.46s
2026-05-08 15:30 · सूट बदला गया	3.4	6.7	10.0	4/19	5	229,186	11,661	$0.000	17.13s
अंतर	+1.9	-0.8	0.0	+2	+3	+6097	-11661	$0.000	-2668ms

इन दो रन में अलग-अलग बेंचमार्क सूट इस्तेमाल हुए थे, इसलिए अंतर मॉडल बदलाव और सूट बदलाव दोनों को दर्शाते हैं।

चार्ट

पहले मॉडल चुनें, फिर दूसरा मॉडल क्लिक करके साइड-बाय-साइड पेज खोलें।

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

श्रेणी	स्कोर	संगति
एंटी-एआई ट्रिक्स	7.0	5.9
कोडिंग	3.3	1.7
संयुक्त	0.0	0.0
डेटा पार्सिंग और निष्कर्षण	7.3	5.9
डोमेन-विशिष्ट	2.9	7.2
Samanya Buddhimatta	4.8	9.9
निर्देश पालन	6.9	6.3
पहेली समाधान	3.5	4.4
टूल कॉलिंग	0.0	0.0

Nemotron 3 Nano Omni 30b A3b Reasoning

चार्ट

स्कोर के अनुसार शीर्ष मॉडल

स्कोर vs कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

तुलना किए गए मॉडल