नेव्हिगेशन
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Nemotron 3 Ultra 550b A55b

सारांश

Claude Opus 4.8 vs Nemotron 3 Ultra 550b A55b benchmark तुलना: Claude Opus 4.8 average score मध्ये पुढे आहे: 8.8 vs 8.1. Nemotron 3 Ultra 550b A55b चा benchmark खर्च कमी आहे: $0.158 vs $1.107. Claude Opus 4.8 वेगवान आहे: 9.66s vs 15.05s, pass rates 84.1% vs 69.8%.

शिफारस केलेले मॉडेल: Nemotron 3 Ultra 550b A55b - Its score stays close to the best score here (8.1 vs 8.8), while costing about 7.0x less than Claude Opus 4.8.

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-06-18

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 medium प्रकाशन: 2026-05-28 Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b medium प्रकाशन: 2026-06-04 मोफत उपलब्ध
स्कोअर 8.8 8.1
क्रमांक #12 #26
विश्वसनीयता 10.0 9.7
सुसंगतता 9.6 8.8
बरोबर चाचण्या
प्रति प्रयत्न पास दर 84.1% 69.8%
अस्थिर चाचण्या 1 3
एकूण रन 63 63
प्रति निकाल खर्च 6.512 0.000
एकूण खर्च $1.107 $0.158
इनपुट किंमत $5.000 / 1M $0.500 / 1M
आउटपुट किंमत $25.000 / 1M $2.200 / 1M
एकूण इनपुट टोकन्स 61,007 46,813
आउटपुट टोकन्स 26,495 18,002
रिझनिंग टोकन्स 5,901 53,091
प्रतिसाद वेळ (सरासरी) 9.66s 15.05s
प्रतिसाद वेळ (कमाल) 38.03s 43.93s
प्रतिसाद वेळ (एकूण) 202.89s 316.09s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#12 Claude Opus 4.8

medium
खर्च
$0.057
वेळ
23.1s
टोकन्स
2,412 tok

#26 Nemotron 3 Ultra 550b A55b

medium
अवैध SVG
खर्च
$0.000
वेळ
300.0s
टोकन्स
0 tok

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 834 1,179 478
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 8.62s 780 835 1,485
कोडिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 15.33s 10,590 9,945 1,381
Nemotron 3 Ultra 550b A55b 8.4 7.4 88.9% 1 26.53s 7,686 2,854 17,725
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 23,561 5,260 1,588
Nemotron 3 Ultra 550b A55b 9.8 10.0 100.0% 0 43.93s 17,574 1,040 3,590
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 10,503 481 312
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 5.68s 7,989 473 1,285
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 975 7,477 900
Nemotron 3 Ultra 550b A55b 3.5 4.4 33.3% 2 24.90s 858 11,169 16,249
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 708 237 0
Nemotron 3 Ultra 550b A55b 3.7 9.5 0.0% 0 2.52s 360 70 235
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 909 373 320
Nemotron 3 Ultra 550b A55b 9.8 10.0 100.0% 0 6.35s 765 182 1,243
कोडी सोडवणे स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 894 791 483
Nemotron 3 Ultra 550b A55b 5.5 9.9 33.3% 0 3.54s 792 771 2,055
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 11,775 301 225
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 7.72s 9,781 304 984
सामान्य ज्ञान स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) इनपुट टोकन्स आउटपुट टोकन्स रिझनिंग टोकन्स
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 258 451 214
Nemotron 3 Ultra 550b A55b 3.0 10.0 0.0% 0 38.47s 228 304 8,240

झटपट तुलना

तुलना जोडी बदला