Navigation
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Nemotron 3 Ultra 550b A55b vs OpenAI: gpt-oss-120b

Résumé

Comparaison benchmark Nemotron 3 Ultra 550b A55b vs gpt-oss-120b : Nemotron 3 Ultra 550b A55b mène au score moyen avec 6.1 vs 4.0. gpt-oss-120b a le coût de benchmark le plus bas avec $0.010 vs $0.027. Nemotron 3 Ultra 550b A55b est plus rapide avec 2.27s vs 21.61s, avec des taux de réussite de 44.4% vs 34.9%.

Modèle recommandé: Nemotron 3 Ultra 550b A55b - Il obtient le meilleur score ici (6.1) et répond environ 9.5x plus vite que gpt-oss-120b.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-18

Métrique Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b none Sortie: 2026-06-04 Disponible gratuitement gpt-oss-120b gpt-oss-120b none Sortie: 2025-08-05 Disponible gratuitement
Score 6.1 4.0
Rang #99 #164
Fiabilité 10.0 10.0
Cohérence 9.2 8.2
Tests corrects
Taux de réussite par tentative 44.4% 34.9%
Tests instables 2 2
Exécutions totales 63 57
Coût par résultat 0.000 0.168
Coût total $0.027 $0.010
Prix d'entrée $0.500 / 1M $0.039 / 1M
Prix de sortie $2.200 / 1M $0.180 / 1M
Total des jetons d'entrée 43,326 9,081
Jetons de sortie 2,138 51,664
Jetons de raisonnement 0 0
Temps de réponse (moy.) 2.27s 21.61s
Temps de réponse (max) 13.49s 113.71s
Temps de réponse (total) 47.65s 345.79s

Génération showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#99 Nemotron 3 Ultra 550b A55b

none
Coût
$0.000
Temps
149.6s
Tokens
3,405 tok

#164 gpt-oss-120b

none
Aucun résultat showcase n'a encore été généré pour ce modèle.
Coût
$0.000
Temps
-
Tokens
0 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Nemotron 3 Ultra 550b A55b 3.5 8.0 16.7% 1 2.35s 696 239 0
gpt-oss-120b 6.5 10.0 50.0% 0 32.84s 1,336 8,676 0
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Nemotron 3 Ultra 550b A55b 5.5 10.0 33.3% 0 1.02s 7,623 369 0
gpt-oss-120b 1.5 4.0 22.2% 1 9.57s 901 3,232 0
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Nemotron 3 Ultra 550b A55b 3.0 10.0 0.0% 0 4.79s 15,558 357 0
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0 0
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 1.94s 7,944 249 0
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 2,421 598 0
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Nemotron 3 Ultra 550b A55b 5.3 10.0 33.3% 0 698ms 789 27 0
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 1,294 29,483 0
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Nemotron 3 Ultra 550b A55b 5.0 10.0 0.0% 0 13.49s 516 101 0
gpt-oss-120b 4.8 10.0 0.0% 0 10.79s 584 615 0
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 1.46s 723 69 0
gpt-oss-120b 9.8 10.0 100.0% 0 5.06s 1,043 1,940 0
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Nemotron 3 Ultra 550b A55b 5.9 7.2 55.6% 1 1.06s 726 352 0
gpt-oss-120b 6.0 7.2 55.6% 1 8.21s 1,188 3,982 0
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Nemotron 3 Ultra 550b A55b 10.0 10.0 100.0% 0 2.99s 8,544 264 0
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0 0
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Nemotron 3 Ultra 550b A55b 3.0 10.0 0.0% 0 1.83s 207 111 0
gpt-oss-120b 3.0 10.0 0.0% 0 47.29s 314 3,138 0

Comparaison rapide

Changer la paire de comparaison