Comparaison benchmark Nemotron 3 Ultra 550b A55b vs Hunter Alpha : Nemotron 3 Ultra 550b A55b mène au score moyen avec 7.5 vs 6.7. Hunter Alpha a le coût de benchmark le plus bas avec $0.000 vs $0.177. Hunter Alpha est plus rapide avec 10.33s vs 15.05s, avec des taux de réussite de 69.8% vs 64.8%.
Modèle recommandé: Nemotron 3 Ultra 550b A55b - Il obtient le meilleur score de cette comparaison (7.5) et le meilleur équilibre global entre coût et temps de réponse sur les 2 modèles.
Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-10
Hunter AlphaHunter AlphamediumModèle archivé : ce modèle n'est plus mis à jour ni testé sur de nouveaux tests.Sortie: 2026-03-11
Score
7.5Score moyen sur l’ensemble des tests de benchmark.…
6.7Score moyen sur l’ensemble des tests de benchmark.…
Rang
#42
#80
Fiabilité
9.7Score de réussite au premier essai : 10.0 signifie aucun échec réessayable de l'API cible ou de limite de débit avant les appels réussis ; les échecs suivis réduisent le score.…
N/DScore de réussite au premier essai : 10.0 signifie aucun échec réessayable de l'API cible ou de limite de débit avant les appels réussis ; les échecs suivis réduisent le score.…
Cohérence
8.8Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
7.4Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
Tests corrects
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 7Erreur API: 1Temps de réponse (moy.)15.05sTemps de réponse (max)43.93sTemps de réponse (total)316.09sUn test est entièrement réussi uniquement si toutes ses exécutions réussissent.…
69.8%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
64.8%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
Tests instables
3Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
6Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
Exécutions totales
63Exécutions totales…
52Exécutions totales…
Coût par résultat
0.000Affiche le coût moyen par réponse correcte du benchmark, en centimes (plus bas est meilleur).…
0.000Affiche le coût moyen par réponse correcte du benchmark, en centimes (plus bas est meilleur).…
Coût total
$0.177Coût total (prix actuel)…
$0.000Coût total (prix actuel)…
Prix d'entrée
$0.500 / 1MPrix d'entrée…
$0.000 / 1MPrix d'entrée…
Prix de sortie
$2.500 / 1MPrix de sortie…
$0.000 / 1MPrix de sortie…
Total des jetons d'entrée
46,813Total des jetons d'entrée…
28,927Total des jetons d'entrée…
Jetons de sortie
18,002Jetons de sortie…
4,682Jetons de sortie…
Jetons de raisonnement
53,091Jetons de raisonnement…
17,969Jetons de raisonnement…
Temps de réponse (moy.)
15.05sTemps de réponse (moy.)…
10.33sTemps de réponse (moy.)…
Temps de réponse (max)
43.93sTemps de réponse (max)…
30.53sTemps de réponse (max)…
Temps de réponse (total)
316.09sTemps de réponse (total)…
175.58sTemps de réponse (total)…
Generation showcase
Hamster playing table tennis
Prompt: Create a detailed SVG illustration of a hamster playing table tennis.
#42 Nemotron 3 Ultra 550b A55b
medium
No showcase result has been generated for this model yet.
Cost
$0.000
Time
-
Tokens
0 tok
#80 Hunter Alpha
medium
Hunter Alpha was a stealth model revealed on March 18th as an early testing version of MiMo-V2-Pro. Find it here: https://openrouter.ai/xiaomi/mimo-v2-pro
10.0Score moyen sur l’ensemble des tests de benchmark.…
10.0Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
100.0%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
0Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)8.62sTemps de réponse (max)16.86sTemps de réponse (total)34.49sUn test est entièrement réussi uniquement si toutes ses exécutions réussissent.…
8.62sTemps de réponse (moy.)…
780Total des jetons d'entrée…
835Jetons de sortie…
1,485Jetons de raisonnement…
Hunter AlphaModèle archivé : ce modèle n'est plus mis à jour ni testé sur de nouveaux tests.
7.3Score moyen sur l’ensemble des tests de benchmark.…
5.8Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
83.3%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
2Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)4.75sTemps de réponse (max)7.62sTemps de réponse (total)19.00sUn test est entièrement réussi uniquement si toutes ses exécutions réussissent.…
8.4Score moyen sur l’ensemble des tests de benchmark.…
7.4Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
88.9%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
1Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)26.53sTemps de réponse (max)31.91sTemps de réponse (total)79.58sUn test est entièrement réussi uniquement si toutes ses exécutions réussissent.…
26.53sTemps de réponse (moy.)…
7,686Total des jetons d'entrée…
2,854Jetons de sortie…
17,725Jetons de raisonnement…
Hunter AlphaModèle archivé : ce modèle n'est plus mis à jour ni testé sur de nouveaux tests.
3.0Score moyen sur l’ensemble des tests de benchmark.…
10.0Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
0.0%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
0Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)0msTemps de réponse (max)0msTemps de réponse (total)0msUn test est entièrement réussi uniquement si toutes ses exécutions réussissent.…
9.8Score moyen sur l’ensemble des tests de benchmark.…
10.0Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
100.0%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
0Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)43.93sTemps de réponse (max)43.93sTemps de réponse (total)43.93sUn test est entièrement réussi uniquement si toutes ses exécutions réussissent.…
43.93sTemps de réponse (moy.)…
17,574Total des jetons d'entrée…
1,040Jetons de sortie…
3,590Jetons de raisonnement…
Hunter AlphaModèle archivé : ce modèle n'est plus mis à jour ni testé sur de nouveaux tests.
4.7Score moyen sur l’ensemble des tests de benchmark.…
1.6Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
66.7%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
1Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Délai dépassé: 1Temps de réponse (moy.)30.53sTemps de réponse (max)30.53sTemps de réponse (total)30.53sUn test est entièrement réussi uniquement si toutes ses exécutions réussissent.…
10.0Score moyen sur l’ensemble des tests de benchmark.…
10.0Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
100.0%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
0Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)5.68sTemps de réponse (max)7.94sTemps de réponse (total)11.36sUn test est entièrement réussi uniquement si toutes ses exécutions réussissent.…
5.68sTemps de réponse (moy.)…
7,989Total des jetons d'entrée…
473Jetons de sortie…
1,285Jetons de raisonnement…
Hunter AlphaModèle archivé : ce modèle n'est plus mis à jour ni testé sur de nouveaux tests.
10.0Score moyen sur l’ensemble des tests de benchmark.…
10.0Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
100.0%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
0Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)23.16sTemps de réponse (max)26.55sTemps de réponse (total)46.33sUn test est entièrement réussi uniquement si toutes ses exécutions réussissent.…
3.5Score moyen sur l’ensemble des tests de benchmark.…
4.4Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
33.3%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
2Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 3Temps de réponse (moy.)24.90sTemps de réponse (max)34.96sTemps de réponse (total)74.71sUn test est entièrement réussi uniquement si toutes ses exécutions réussissent.…
24.90sTemps de réponse (moy.)…
858Total des jetons d'entrée…
11,169Jetons de sortie…
16,249Jetons de raisonnement…
Hunter AlphaModèle archivé : ce modèle n'est plus mis à jour ni testé sur de nouveaux tests.
3.0Score moyen sur l’ensemble des tests de benchmark.…
10.0Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
0.0%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
0Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mise en forme supplémentaire: 1Délai dépassé: 1Mauvaise réponse: 1Temps de réponse (moy.)10.52sTemps de réponse (max)18.68sTemps de réponse (total)31.56sUn test est entièrement réussi uniquement si toutes ses exécutions réussissent.…
3.7Score moyen sur l’ensemble des tests de benchmark.…
9.5Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
0.0%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
0Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Erreur API: 1Temps de réponse (moy.)2.52sTemps de réponse (max)2.52sTemps de réponse (total)2.52sUn test est entièrement réussi uniquement si toutes ses exécutions réussissent.…
2.52sTemps de réponse (moy.)…
360Total des jetons d'entrée…
70Jetons de sortie…
235Jetons de raisonnement…
Hunter AlphaModèle archivé : ce modèle n'est plus mis à jour ni testé sur de nouveaux tests.
7.0Score moyen sur l’ensemble des tests de benchmark.…
3.7Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
66.7%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
1Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Temps de réponse (moy.)6.44sTemps de réponse (max)6.44sTemps de réponse (total)6.44sUn test est entièrement réussi uniquement si toutes ses exécutions réussissent.…
9.8Score moyen sur l’ensemble des tests de benchmark.…
10.0Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
100.0%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
0Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)6.35sTemps de réponse (max)9.38sTemps de réponse (total)12.69sUn test est entièrement réussi uniquement si toutes ses exécutions réussissent.…
6.35sTemps de réponse (moy.)…
765Total des jetons d'entrée…
182Jetons de sortie…
1,243Jetons de raisonnement…
Hunter AlphaModèle archivé : ce modèle n'est plus mis à jour ni testé sur de nouveaux tests.
9.9Score moyen sur l’ensemble des tests de benchmark.…
10.0Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
100.0%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
0Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)4.18sTemps de réponse (max)4.46sTemps de réponse (total)8.36sUn test est entièrement réussi uniquement si toutes ses exécutions réussissent.…
5.5Score moyen sur l’ensemble des tests de benchmark.…
9.9Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
33.3%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
0Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 2Temps de réponse (moy.)3.54sTemps de réponse (max)6.03sTemps de réponse (total)10.62sUn test est entièrement réussi uniquement si toutes ses exécutions réussissent.…
3.54sTemps de réponse (moy.)…
792Total des jetons d'entrée…
771Jetons de sortie…
2,055Jetons de raisonnement…
Hunter AlphaModèle archivé : ce modèle n'est plus mis à jour ni testé sur de nouveaux tests.
6.1Score moyen sur l’ensemble des tests de benchmark.…
4.7Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
66.7%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
2Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.N'a pas suivi les instructions: 1Mauvaise réponse: 1Temps de réponse (moy.)5.35sTemps de réponse (max)6.20sTemps de réponse (total)16.06sUn test est entièrement réussi uniquement si toutes ses exécutions réussissent.…
10.0Score moyen sur l’ensemble des tests de benchmark.…
10.0Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
100.0%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
0Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)7.72sTemps de réponse (max)7.72sTemps de réponse (total)7.72sUn test est entièrement réussi uniquement si toutes ses exécutions réussissent.…
7.72sTemps de réponse (moy.)…
9,781Total des jetons d'entrée…
304Jetons de sortie…
984Jetons de raisonnement…
Hunter AlphaModèle archivé : ce modèle n'est plus mis à jour ni testé sur de nouveaux tests.
10.0Score moyen sur l’ensemble des tests de benchmark.…
10.0Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
100.0%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
0Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Aucune réponse échouée.Temps de réponse (moy.)17.33sTemps de réponse (max)17.33sTemps de réponse (total)17.33sUn test est entièrement réussi uniquement si toutes ses exécutions réussissent.…
3.0Score moyen sur l’ensemble des tests de benchmark.…
10.0Le score de cohérence reflète la stabilité entre exécutions (10 = très cohérent, même si constamment faux).…
0.0%Taux de réussite par tentative = tentatives réussies / tentatives totales sur toutes les exécutions.…
0Les tests instables ont eu des résultats mixtes entre exécutions (au moins une réussite et un échec).…
Un test est entièrement réussi uniquement si toutes ses exécutions réussissent.Mauvaise réponse: 1Temps de réponse (moy.)38.47sTemps de réponse (max)38.47sTemps de réponse (total)38.47sUn test est entièrement réussi uniquement si toutes ses exécutions réussissent.…
38.47sTemps de réponse (moy.)…
228Total des jetons d'entrée…
304Jetons de sortie…
8,240Jetons de raisonnement…
Hunter AlphaModèle archivé : ce modèle n'est plus mis à jour ni testé sur de nouveaux tests.