AI BENCHY Compare

IBM: Granite 4.1 8B vs xAI: Grok 4.1 Fast

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-01

Metrică	Granite 4.1 8B Granite 4.1 8B none Lansare: 2026-05-01	Grok 4.1 Fast Grok 4.1 Fast none Lansare: 2025-11-19

Metrică	Granite 4.1 8B Granite 4.1 8B none Lansare: 2026-05-01	Grok 4.1 Fast Grok 4.1 Fast none Lansare: 2025-11-19
Scor	4.3	4.5
Rang	#135	#130
Fiabilitate	10.0	N/D
Consistență	10.0	8.7
Teste corecte
Rată de trecere pe încercare	11.1%	24.1%
Teste instabile	0	3
Rulări totale	54	54
Cost per rezultat	0.110	0.269
Cost total	$0.003	$0.009
Preț de intrare	$0.050 / 1M	$0.200 / 1M
Preț de ieșire	$0.100 / 1M	$0.500 / 1M
Tokenuri de ieșire	2,712	1,721
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	767ms	1.76s
Timp de răspuns (maxim)	2.17s	5.51s
Timp de răspuns (total)	13.81s	19.35s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	4.9	10.0	25.0%	0		844ms	903	0
Grok 4.1 Fast	3.2	10.0	0.0%	0		1.07s	235	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	6.9	10.0	0.0%	0		1.07s	339	0
Grok 4.1 Fast	5.3	3.4	33.3%	1		1.79s	567	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.0	10.0	0.0%	0		1.88s	396	0
Grok 4.1 Fast	3.0	10.0	0.0%	0		3.33s	105	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.0	10.0	0.0%	0		575ms	195	0
Grok 4.1 Fast	10.0	10.0	100.0%	0		943ms	180	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.0	10.0	0.0%	0		357ms	24	0
Grok 4.1 Fast	5.9	7.2	55.6%	1		1.06s	15	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	4.0	10.0	0.0%	0		499ms	115	0
Grok 4.1 Fast	4.4	9.9	0.0%	0		1.08s	112	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.6	9.9	0.0%	0		344ms	66	0
Grok 4.1 Fast	3.0	10.0	0.0%	0		923ms	56	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.7	10.0	0.0%	0		635ms	431	0
Grok 4.1 Fast	3.2	10.0	0.0%	0		1.28s	243	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	10.0	10.0	100.0%	0		2.17s	243	0
Grok 4.1 Fast	2.8	1.6	33.3%	1		5.51s	208	0

Comparație rapidă

Schimbă perechea de comparație

Grok 4.1 FastnonevsGLM 4.7 Flashmedium Granite 4.1 8BnonevsQwen3.5-9Bmedium Qwen3.5-9BmediumvsGrok 4.1 Fastnone Granite 4.1 8BnonevsGLM 4.7 Flashmedium Qwen3 Coder NextmediumvsGrok 4.1 Fastnone Granite 4.1 8BnonevsQwen3 Coder Nextmedium Nemotron 3 Nano Omni 30b A3b ReasoningmediumDisponibil gratuitvsGrok 4.1 Fastnone Elephant AlphamediumvsGrok 4.1 Fastnone MiniMax M2.7mediumvsGrok 4.1 Fastnone Granite 4.1 8BnonevsNemotron 3 Nano Omni 30b A3b ReasoningmediumDisponibil gratuit Granite 4.1 8BnonevsElephant Alphamedium Granite 4.1 8BnonevsMiniMax M2.7medium