AI BENCHY Compare

IBM: Granite 4.1 8B vs Mistral: Mistral Small 4

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-29

Metrică	Granite 4.1 8B Granite 4.1 8B none Lansare: 2026-05-01	Mistral Small 4 Mistral Small 4 none Lansare: 2026-03-16

Metrică	Granite 4.1 8B Granite 4.1 8B none Lansare: 2026-05-01	Mistral Small 4 Mistral Small 4 none Lansare: 2026-03-16
Scor	4.1	5.0
Rang	#158	#140
Fiabilitate	10.0	10.0
Consistență	10.0	9.5
Teste corecte
Rată de trecere pe încercare	10.0%	28.3%
Teste instabile	0	1
Rulări totale	60	60
Cost per rezultat	0.122	0.131
Cost total	$0.003	$0.007
Preț de intrare	$0.050 / 1M	$0.150 / 1M
Preț de ieșire	$0.100 / 1M	$0.600 / 1M
Tokenuri de ieșire	2,743	2,192
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	719ms	629ms
Timp de răspuns (maxim)	2.17s	1.72s
Timp de răspuns (total)	14.37s	12.59s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	4.9	10.0	25.0%	0		844ms	903	0
Mistral Small 4	3.4	7.9	16.7%	1		395ms	182	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	5.2	10.0	0.0%	0		706ms	357	0
Mistral Small 4	4.0	9.5	0.0%	0		1.03s	610	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.0	10.0	0.0%	0		1.88s	396	0
Mistral Small 4	3.0	10.0	0.0%	0		1.72s	496	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.0	10.0	0.0%	0		575ms	195	0
Mistral Small 4	10.0	10.0	100.0%	0		822ms	261	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.0	10.0	0.0%	0		357ms	24	0
Mistral Small 4	5.3	10.0	33.3%	0		367ms	28	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	4.0	10.0	0.0%	0		499ms	115	0
Mistral Small 4	4.0	10.0	0.0%	0		729ms	205	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.6	9.9	0.0%	0		344ms	66	0
Mistral Small 4	6.5	10.0	50.0%	0		380ms	69	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.2	10.0	0.0%	0		608ms	432	0
Mistral Small 4	3.1	9.9	0.0%	0		399ms	111	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	10.0	10.0	100.0%	0		2.17s	243	0
Mistral Small 4	10.0	10.0	100.0%	0		1.40s	213	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.0	10.0	0.0%	0		306ms	12	0
Mistral Small 4	3.0	10.0	0.0%	0		397ms	17	0

Comparație rapidă

Schimbă perechea de comparație

Granite 4.1 8BnonevsQwen3.5-9Bmedium Mistral Small 4nonevsQwen3 Coder Nextmedium Granite 4.1 8BnonevsGLM 4.7 Flashmedium MiniMax M2.7mediumvsMistral Small 4none Mistral Small 4nonevsElephant Alphamedium MiniMax M2.5mediumDisponibil gratuitvsMistral Small 4none Mistral Small 4nonevsGLM 4.7 Flashmedium Granite 4.1 8BnonevsQwen3 Coder Nextmedium Mistral Small 4nonevsQwen3.5-9Bmedium CobuddymediumvsMistral Small 4none Mistral Small 4nonevsOwl Alphamedium Mistral Small 4nonevsgpt-oss-120bmediumDisponibil gratuit