Navigare
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 5 vs NVIDIA: Nemotron 3 Super

Rezumat

Comparație benchmark Claude Sonnet 5 vs Nemotron 3 Super: Nemotron 3 Super conduce la scorul mediu cu 6.3 vs 5.7. Nemotron 3 Super are costul de benchmark mai mic, $0.019 vs $0.287. Claude Sonnet 5 este mai rapid cu 4.74s vs 32.00s, cu rate de reușită de 42.9% vs 41.3%.

Model recomandat: Nemotron 3 Super - Are cel mai bun scor aici (6.3) și costă de aproximativ 15.8x mai puțin decât Claude Sonnet 5.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-30

Metrică Claude Sonnet 5 Claude Sonnet 5 none Lansare: 2026-06-30 Nemotron 3 Super Nemotron 3 Super medium Lansare: 2026-03-11 Disponibil gratuit
Scor 5.7 6.3
Rang #117 #89
Fiabilitate 10.0 10.0
Consistență 8.6 9.2
Teste corecte
Rată de trecere pe încercare 42.9% 41.3%
Teste instabile 4 2
Rulări totale 63 63
Cost per rezultat 4.098 0.004
Cost total $0.287 $0.019
Preț de intrare $2.000 / 1M $0.085 / 1M
Preț de ieșire $10.000 / 1M $0.400 / 1M
Total tokenuri de intrare 76,797 37,527
Tokenuri de ieșire 13,325 14,850
Tokenuri de raționament 0 33,754
Timp de răspuns (mediu) 4.74s 32.00s
Timp de răspuns (maxim) 29.46s 232.25s
Timp de răspuns (total) 99.46s 607.91s

Prezentare generare

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 Claude Sonnet 5

none
Cost
$0.061
Timp
53.7s
Tokenuri
6,172 tok

#89 Nemotron 3 Super

medium
Cost
$0.000
Timp
272.6s
Tokenuri
5,296 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 5 5.3 10.0 25.0% 0 3.60s 834 1,813 0
Nemotron 3 Super 8.3 10.0 75.0% 0 7.85s 686 748 1,305
Programare Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 5 4.6 7.9 22.2% 1 3.67s 10,590 1,864 0
Nemotron 3 Super 3.1 10.0 0.0% 0 147.32s 2,275 797 4,424
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 5 3.0 10.0 0.0% 0 29.46s 38,775 6,340 0
Nemotron 3 Super 10.0 10.0 100.0% 0 87.80s 15,561 2,021 9,996
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 5 10.0 10.0 100.0% 0 3.01s 10,503 309 0
Nemotron 3 Super 10.0 10.0 100.0% 0 18.16s 7,944 877 2,607
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 5 5.3 7.2 44.4% 1 3.28s 975 933 0
Nemotron 3 Super 2.9 4.4 22.2% 2 16.19s 456 5,255 6,072
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 5 4.7 3.1 33.3% 1 2.81s 708 272 0
Nemotron 3 Super 4.1 10.0 0.0% 0 6.91s 492 105 363
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 5 6.4 10.0 50.0% 0 2.58s 909 103 0
Nemotron 3 Super 7.3 10.0 50.0% 0 6.97s 723 956 2,383
Rezolvare de puzzle-uri Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 5 6.0 7.4 55.6% 1 3.22s 894 778 0
Nemotron 3 Super 3.0 10.0 0.0% 0 3.15s 708 570 1,322
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 5 10.0 10.0 100.0% 0 6.80s 12,351 522 0
Nemotron 3 Super 10.0 10.0 100.0% 0 39.75s 8,544 270 1,969
Cultură generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de intrare Tokenuri de ieșire Tokenuri de raționament
Claude Sonnet 5 3.0 10.0 0.0% 0 4.31s 258 391 0
Nemotron 3 Super 3.0 10.0 0.0% 0 55.32s 138 3,251 3,313

Comparație rapidă

Schimbă perechea de comparație