नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Nemotron 3 Ultra 550b A55b vs xAI: Grok Build 0.1

सारांश

Nemotron 3 Ultra 550b A55b vs Grok Build 0.1 benchmark तुलना: Nemotron 3 Ultra 550b A55b average score में आगे है: 8.1 vs 7.6. Nemotron 3 Ultra 550b A55b की benchmark लागत कम है: $0.158 vs $0.927. Nemotron 3 Ultra 550b A55b तेज है: 15.05s vs 49.90s, pass rates 69.8% vs 61.9%.

अनुशंसित मॉडल: Nemotron 3 Ultra 550b A55b - It has the best score here (8.1), while costing about 5.9x less than Grok Build 0.1.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-07-02

मेट्रिक Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b medium रिलीज़: 2026-06-04 निःशुल्क उपलब्ध Grok Build 0.1 Grok Build 0.1 medium रिलीज़: 2026-05-21
स्कोर 8.1 7.6
रैंक #26 #44
विश्वसनीयता 9.7 10.0
संगति 8.8 9.9
सही परीक्षण
प्रति प्रयास पास दर 69.8% 61.9%
अस्थिर टेस्ट 3 0
कुल रन 63 63
प्रति परिणाम लागत 0.000 7.124
कुल लागत $0.158 $0.927
इनपुट कीमत $0.500 / 1M $1.000 / 1M
आउटपुट कीमत $2.200 / 1M $2.000 / 1M
कुल इनपुट टोकन 46,813 44,418
आउटपुट टोकन 18,002 2,782
रीजनिंग टोकन 53,091 438,018
प्रतिक्रिया समय (औसत) 15.05s 49.90s
प्रतिक्रिया समय (अधिकतम) 43.93s 252.69s
प्रतिक्रिया समय (कुल) 316.09s 1047.92s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#26 Nemotron 3 Ultra 550b A55b

medium
अमान्य SVG
लागत
$0.000
समय
300.0s
टोकन
0 tok

#44 xAI: Grok Build 0.1

medium
लागत
$0.028
समय
81.3s
टोकन
14,009 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 8.62s 780 835 1,485
Grok Build 0.1 8.3 10.0 75.0% 0 7.43s 2,010 220 12,162
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Nemotron 3 Ultra 550b A55b 8.4 7.4 88.9% 1 26.53s 7,686 2,854 17,725
Grok Build 0.1 5.7 9.7 33.3% 0 108.46s 8,304 1,138 161,452
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Nemotron 3 Ultra 550b A55b 9.8 10.0 100.0% 0 43.93s 17,574 1,040 3,590
Grok Build 0.1 10.0 10.0 100.0% 0 32.81s 12,909 231 16,917
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 5.68s 7,989 473 1,285
Grok Build 0.1 10.0 10.0 100.0% 0 10.72s 7,761 180 8,876
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Nemotron 3 Ultra 550b A55b 3.5 4.4 33.3% 2 24.90s 858 11,169 16,249
Grok Build 0.1 5.3 10.0 33.3% 0 158.00s 1,764 492 175,294
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Nemotron 3 Ultra 550b A55b 3.7 9.5 0.0% 0 2.52s 360 70 235
Grok Build 0.1 4.4 9.9 0.0% 0 18.41s 825 76 6,345
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Nemotron 3 Ultra 550b A55b 9.8 10.0 100.0% 0 6.35s 765 182 1,243
Grok Build 0.1 9.8 10.0 100.0% 0 12.36s 1,362 57 9,599
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Nemotron 3 Ultra 550b A55b 5.5 9.9 33.3% 0 3.54s 792 771 2,055
Grok Build 0.1 7.7 10.0 66.7% 0 18.26s 1,689 195 20,841
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 7.72s 9,781 304 984
Grok Build 0.1 10.0 10.0 100.0% 0 13.12s 7,263 180 4,969
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Nemotron 3 Ultra 550b A55b 3.0 10.0 0.0% 0 38.47s 228 304 8,240
Grok Build 0.1 3.0 10.0 0.0% 0 53.51s 531 13 21,563

त्वरित तुलना

तुलना जोड़ी बदलें