AI BENCHY Compare

IBM: Granite 4.1 8B vs inclusionAI: Ling-2.6-flash

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-05-29

Métrique	Granite 4.1 8B Granite 4.1 8B none Sortie: 2026-05-01	Ling-2.6-flash Ling-2.6-flash none Sortie: 2026-04-21

Métrique	Granite 4.1 8B Granite 4.1 8B none Sortie: 2026-05-01	Ling-2.6-flash Ling-2.6-flash none Sortie: 2026-04-21
Score	4.1	5.3
Rang	#158	#135
Fiabilité	10.0	10.0
Cohérence	10.0	9.2
Tests corrects
Taux de réussite par tentative	10.0%	35.1%
Tests instables	0	2
Exécutions totales	60	60
Coût par résultat	0.122	0.005
Coût total	$0.003	$0.001
Prix d'entrée	$0.050 / 1M	$0.010 / 1M
Prix de sortie	$0.100 / 1M	$0.030 / 1M
Jetons de sortie	2,743	2,878
Jetons de raisonnement	0	0
Temps de réponse (moy.)	719ms	9.34s
Temps de réponse (max)	2.17s	35.34s
Temps de réponse (total)	14.37s	177.48s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Granite 4.1 8B	4.9	10.0	25.0%	0		844ms	903	0
Ling-2.6-flash	6.8	8.1	58.3%	1		11.81s	573	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Granite 4.1 8B	5.2	10.0	0.0%	0		706ms	357	0
Ling-2.6-flash	10.0	10.0	100.0%	0		11.21s	381	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Granite 4.1 8B	3.0	10.0	0.0%	0		1.88s	396	0
Ling-2.6-flash	3.0	10.0	0.0%	0		35.34s	1,069	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Granite 4.1 8B	3.0	10.0	0.0%	0		575ms	195	0
Ling-2.6-flash	6.5	10.0	50.0%	0		8.48s	246	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Granite 4.1 8B	3.0	10.0	0.0%	0		357ms	24	0
Ling-2.6-flash	3.0	10.0	0.0%	0		4.95s	24	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Granite 4.1 8B	4.0	10.0	0.0%	0		499ms	115	0
Ling-2.6-flash	4.0	10.0	0.0%	0		1.45s	109	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Granite 4.1 8B	3.6	9.9	0.0%	0		344ms	66	0
Ling-2.6-flash	9.8	10.0	100.0%	0		5.52s	81	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Granite 4.1 8B	3.2	10.0	0.0%	0		608ms	432	0
Ling-2.6-flash	2.9	7.2	11.1%	1		6.51s	151	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Granite 4.1 8B	10.0	10.0	100.0%	0		2.17s	243	0
Ling-2.6-flash	3.0	10.0	0.0%	0		18.80s	229	0

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Granite 4.1 8B	3.0	10.0	0.0%	0		306ms	12	0
Ling-2.6-flash	3.0	10.0	0.0%	0		1.06s	15	0

Comparaison rapide

Changer la paire de comparaison

Ling-2.6-flashnonevsMiniMax M2.7medium Ling-2.6-flashnonevsElephant Alphamedium Ling-2.6-flashnonevsMistral Small 4medium Granite 4.1 8BnonevsQwen3.5-9Bmedium Ling-2.6-flashnonevsMiniMax M2.5mediumDisponible gratuitement Granite 4.1 8BnonevsGLM 4.7 Flashmedium CobuddymediumvsLing-2.6-flashnone Ling-2.6-flashnonevsQwen3 Coder Nextmedium Ling-2.6-flashnonevsOwl Alphamedium Granite 4.1 8BnonevsQwen3 Coder Nextmedium Ling-2.6-flashnonevsgpt-oss-120bmediumDisponible gratuitement Ling-2.6-flashnonevsNemotron 3 SupermediumDisponible gratuitement