Navigare
AI BENCHY
Your ad here

AI BENCHY Compare

Nemotron 3 Super 120b A12b vs xAI: Grok 4.20 Multi-Agent Beta

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-12

Metrică Nemotron 3 Super 120b A12b Nemotron 3 Super 120b A12b none Lansare: 2026-03-11 Disponibil gratuit Grok 4.20 Multi-Agent Beta Grok 4.20 Multi-Agent Beta medium Lansare: 2026-03-12
Rang #59 #47
Scor mediu 3.4 4.9
Consistență 8.6 7.1
Cost per rezultat 0.000 97.178
Cost total $0.000 $4.859
Teste corecte
Rată de trecere pe încercare 31.3% 52.1%
Teste instabile 3 6
Rulări totale 48 48
Tokenuri de ieșire 4,222 293,634
Tokenuri de raționament 0 291,260
Timp de răspuns (mediu) 8.90s 9.08s
Timp de răspuns (maxim) 24.97s 35.28s
Timp de răspuns (total) 142.40s 127.09s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor mediu vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor mediu vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Nemotron 3 Super 120b A12b 10.0 10.0 0.0% 0 7.14s 2,171 0
Grok 4.20 Multi-Agent Beta 4.0 4.4 66.7% 2 3.77s 28,392 27,808
Combinat Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Nemotron 3 Super 120b A12b 10.0 10.0 0.0% 0 19.98s 124 0
Grok 4.20 Multi-Agent Beta 10.0 10.0 0.0% 0 0ms 0 0
Parsare și extragere de date Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Nemotron 3 Super 120b A12b 9.9 10.0 100.0% 0 7.92s 249 0
Grok 4.20 Multi-Agent Beta 9.9 10.0 100.0% 0 5.54s 25,306 25,051
Specific domeniului Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Nemotron 3 Super 120b A12b 10.0 7.2 22.2% 1 6.23s 26 0
Grok 4.20 Multi-Agent Beta 10.0 7.2 11.1% 1 24.67s 164,609 163,647
Inteligență generală Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Nemotron 3 Super 120b A12b 3.0 9.9 0.0% 0 24.97s 170 0
Grok 4.20 Multi-Agent Beta 4.0 2.8 66.7% 1 6.40s 15,848 15,746
Respectarea instrucțiunilor Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Nemotron 3 Super 120b A12b 4.5 6.9 33.3% 1 1.50s 66 0
Grok 4.20 Multi-Agent Beta 9.0 10.0 50.0% 0 4.63s 25,457 25,322
Puzzle Solving Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Nemotron 3 Super 120b A12b 4.7 10.0 33.3% 0 7.50s 1,135 0
Grok 4.20 Multi-Agent Beta 6.3 5.1 77.8% 2 5.01s 34,022 33,686
Apelare instrumente Scor Consistență Rată de trecere pe încercare Teste instabile Teste corecte Timp de răspuns (mediu) Tokenuri de ieșire Tokenuri de raționament
Nemotron 3 Super 120b A12b 10.0 1.6 66.7% 1 16.00s 281 0
Grok 4.20 Multi-Agent Beta 10.0 10.0 0.0% 0 0ms 0 0

Comparație rapidă

Schimbă perechea de comparație