Navigation
AI BENCHY
Advertise here

AI BENCHY Compare

Cobuddy vs IBM: Granite 4.1 8B

Résumé

Comparaison benchmark Cobuddy vs Granite 4.1 8B : Cobuddy mène au score moyen avec 4.9 vs 4.0. Cobuddy a le coût de benchmark le plus bas avec $0.000 vs $0.003. Granite 4.1 8B est plus rapide avec 728ms vs 39.90s, avec des taux de réussite de 47.6% vs 9.5%.

Modèle recommandé: Granite 4.1 8B - Il offre le meilleur compromis global: score compétitif (4.0), réponse plus rapide que Cobuddy et coût équilibré.

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-12

Métrique Cobuddy Cobuddy medium Sortie: 2026-05-06 Granite 4.1 8B Granite 4.1 8B none Sortie: 2026-05-01
Score 4.9 4.0
Rang #144 #163
Fiabilité 10.0 10.0
Cohérence 7.5 10.0
Tests corrects
Taux de réussite par tentative 47.6% 9.5%
Tests instables 6 0
Exécutions totales 63 63
Coût par résultat 0.000 0.131
Coût total $0.000 $0.003
Prix d'entrée $0.000 / 1M $0.050 / 1M
Prix de sortie $0.000 / 1M $0.100 / 1M
Total des jetons d'entrée 37,449 46,285
Jetons de sortie 1,677 2,911
Jetons de raisonnement 116,703 0
Temps de réponse (moy.) 39.90s 728ms
Temps de réponse (max) 309.02s 2.17s
Temps de réponse (total) 797.98s 15.29s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#144 Cobuddy

medium
No showcase result has been generated for this model yet.
Cost
$0.000
Time
-
Tokens
0 tok

#163 IBM: Granite 4.1 8B

none
Cost
$0.001
Time
3.2s
Tokens
491 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Cobuddy 8.7 7.9 91.7% 1 10.00s 453 98 4,666
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 645 903 0
Programmation Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Cobuddy 3.7 6.7 22.2% 1 79.17s 4,726 358 30,138
Granite 4.1 8B 4.5 10.0 0.0% 0 775ms 8,344 525 0
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Cobuddy 3.0 10.0 0.0% 0 47.38s 18,324 465 7,265
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 19,089 396 0
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Cobuddy 6.3 5.8 66.7% 1 17.36s 8,181 275 5,591
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 7,617 195 0
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Cobuddy 2.9 4.4 22.2% 2 128.15s 540 10 49,454
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 768 24 0
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Cobuddy 4.2 9.9 0.0% 0 23.23s 498 76 3,782
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 528 115 0
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Cobuddy 9.8 10.0 100.0% 0 11.60s 508 64 2,842
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 687 66 0
Résolution d'énigmes Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Cobuddy 3.6 7.2 22.2% 1 12.83s 561 189 5,808
Granite 4.1 8B 3.2 10.0 0.0% 0 608ms 672 432 0
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Cobuddy 10.0 10.0 100.0% 0 11.19s 3,505 133 294
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 7,719 243 0
Culture générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons d'entrée Jetons de sortie Jetons de raisonnement
Cobuddy 3.0 10.0 0.0% 0 36.98s 153 9 6,863
Granite 4.1 8B 3.0 10.0 0.0% 0 306ms 216 12 0

Comparaison rapide

Changer la paire de comparaison