AI BENCHY Compare

IBM: Granite 4.1 8B vs inclusionAI: Ling-2.6-flash

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-29

Metrică	Granite 4.1 8B Granite 4.1 8B none Lansare: 2026-05-01	Ling-2.6-flash Ling-2.6-flash none Lansare: 2026-04-21

Metrică	Granite 4.1 8B Granite 4.1 8B none Lansare: 2026-05-01	Ling-2.6-flash Ling-2.6-flash none Lansare: 2026-04-21
Scor	4.1	5.3
Rang	#158	#135
Fiabilitate	10.0	10.0
Consistență	10.0	9.2
Teste corecte
Rată de trecere pe încercare	10.0%	35.1%
Teste instabile	0	2
Rulări totale	60	60
Cost per rezultat	0.122	0.005
Cost total	$0.003	$0.001
Preț de intrare	$0.050 / 1M	$0.010 / 1M
Preț de ieșire	$0.100 / 1M	$0.030 / 1M
Tokenuri de ieșire	2,743	2,878
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	719ms	9.34s
Timp de răspuns (maxim)	2.17s	35.34s
Timp de răspuns (total)	14.37s	177.48s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	4.9	10.0	25.0%	0		844ms	903	0
Ling-2.6-flash	6.8	8.1	58.3%	1		11.81s	573	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	5.2	10.0	0.0%	0		706ms	357	0
Ling-2.6-flash	10.0	10.0	100.0%	0		11.21s	381	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.0	10.0	0.0%	0		1.88s	396	0
Ling-2.6-flash	3.0	10.0	0.0%	0		35.34s	1,069	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.0	10.0	0.0%	0		575ms	195	0
Ling-2.6-flash	6.5	10.0	50.0%	0		8.48s	246	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.0	10.0	0.0%	0		357ms	24	0
Ling-2.6-flash	3.0	10.0	0.0%	0		4.95s	24	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	4.0	10.0	0.0%	0		499ms	115	0
Ling-2.6-flash	4.0	10.0	0.0%	0		1.45s	109	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.6	9.9	0.0%	0		344ms	66	0
Ling-2.6-flash	9.8	10.0	100.0%	0		5.52s	81	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.2	10.0	0.0%	0		608ms	432	0
Ling-2.6-flash	2.9	7.2	11.1%	1		6.51s	151	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	10.0	10.0	100.0%	0		2.17s	243	0
Ling-2.6-flash	3.0	10.0	0.0%	0		18.80s	229	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.0	10.0	0.0%	0		306ms	12	0
Ling-2.6-flash	3.0	10.0	0.0%	0		1.06s	15	0

Comparație rapidă

Schimbă perechea de comparație

Ling-2.6-flashnonevsMiniMax M2.7medium Ling-2.6-flashnonevsElephant Alphamedium Ling-2.6-flashnonevsMistral Small 4medium Granite 4.1 8BnonevsQwen3.5-9Bmedium Ling-2.6-flashnonevsMiniMax M2.5mediumDisponibil gratuit Granite 4.1 8BnonevsGLM 4.7 Flashmedium CobuddymediumvsLing-2.6-flashnone Ling-2.6-flashnonevsQwen3 Coder Nextmedium Ling-2.6-flashnonevsOwl Alphamedium Granite 4.1 8BnonevsQwen3 Coder Nextmedium Ling-2.6-flashnonevsgpt-oss-120bmediumDisponibil gratuit Ling-2.6-flashnonevsNemotron 3 SupermediumDisponibil gratuit