नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

NVIDIA: Nemotron 3 Super vs OpenAI: gpt-oss-120b

सारांश

Nemotron 3 Super vs gpt-oss-120b benchmark तुलना: gpt-oss-120b average score में आगे है: 6.1 vs 4.9. Nemotron 3 Super की benchmark लागत कम है: $0.007 vs $0.013. Nemotron 3 Super तेज है: 5.30s vs 22.28s, pass rates 31.8% vs 52.4%.

अनुशंसित मॉडल: Nemotron 3 Super - It offers the best overall trade-off: a competitive score (4.9), lower cost than gpt-oss-120b, and balanced response time.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-10

मेट्रिक Nemotron 3 Super Nemotron 3 Super none रिलीज़: 2026-03-11 निःशुल्क उपलब्ध gpt-oss-120b gpt-oss-120b medium रिलीज़: 2025-08-05 निःशुल्क उपलब्ध
स्कोर 4.9 6.1
रैंक #142 #100
विश्वसनीयता 10.0 10.0
संगति 8.8 8.0
सही परीक्षण
प्रति प्रयास पास दर 31.8% 52.4%
अस्थिर टेस्ट 3 5
कुल रन 63 63
प्रति परिणाम लागत 0.034 0.141
कुल लागत $0.007 $0.013
इनपुट कीमत $0.090 / 1M $0.039 / 1M
आउटपुट कीमत $0.450 / 1M $0.180 / 1M
कुल इनपुट टोकन 36,456 39,084
आउटपुट टोकन 6,195 20,013
रीजनिंग टोकन 0 50,233
प्रतिक्रिया समय (औसत) 5.30s 22.28s
प्रतिक्रिया समय (अधिकतम) 16.45s 68.16s
प्रतिक्रिया समय (कुल) 111.31s 311.96s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#142 Nemotron 3 Super

none
No showcase result has been generated for this model yet.
Cost
$0.000
Time
-
Tokens
0 tok

#100 gpt-oss-120b

medium
Cost
$0.001
Time
26.7s
Tokens
555 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Nemotron 3 Super 4.8 10.0 25.0% 0 4.46s 671 2,322 0
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 1,314 3,518 2,177
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Nemotron 3 Super 3.3 7.2 11.1% 1 2.64s 7,627 571 0
gpt-oss-120b 5.9 7.0 55.6% 1 38.37s 7,782 3,365 11,973
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Nemotron 3 Super 3.0 10.0 0.0% 0 16.45s 8,740 617 0
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 11,535 694 5,072
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Nemotron 3 Super 10.0 10.0 100.0% 0 7.92s 7,944 249 0
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 7,476 241 1,114
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Nemotron 3 Super 3.6 7.2 22.2% 1 6.23s 789 26 0
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 1,266 6,784 20,606
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Nemotron 3 Super 4.6 10.0 0.0% 0 950ms 500 134 0
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 659 107 387
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Nemotron 3 Super 6.3 10.0 50.0% 0 804ms 723 66 0
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 1,036 126 1,799
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Nemotron 3 Super 5.5 10.0 33.3% 0 2.36s 714 1,125 0
gpt-oss-120b 5.3 7.2 44.4% 1 21.71s 1,190 1,790 2,264
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Nemotron 3 Super 4.7 1.6 66.7% 1 16.00s 8,541 281 0
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 6,514 287 1,083
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Nemotron 3 Super 3.0 10.0 0.0% 0 8.94s 207 804 0
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 312 3,101 3,758

त्वरित तुलना

तुलना जोड़ी बदलें