Granite 4.1 8B vs Mercury 2

Model recomandat Mercury 2

Are cel mai bun scor aici (4.6) și răspunde de aproximativ 1.8x mai rapid decât Granite 4.1 8B.

Comparație detaliată

Metrică	Granite 4.1 8B Granite 4.1 8B none Lansare: 2026-05-01	Mercury 2 Mercury 2 none Lansare: 2026-02-24

Metrică	Granite 4.1 8B Granite 4.1 8B none Lansare: 2026-05-01	Mercury 2 Mercury 2 none Lansare: 2026-02-24
Scor	4.0	4.6
Rang	#224	#211
Fiabilitate	10.0	10.0
Consistență	10.0	9.2
Teste corecte
Rată de trecere pe încercare	9.1%	22.7%
Teste instabile	0	2
Rulări totale	66	66
Cost per rezultat	0.315	0.734
Cost total	$0.007	$0.030
Preț de intrare	$0.050 / 1M	$0.250 / 1M
Preț de ieșire	$0.100 / 1M	$0.750 / 1M
Total tokenuri de intrare	113,827	88,704
Tokenuri de ieșire	5,996	9,564
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	1.45s	829ms
Timp de răspuns (maxim)	16.67s	4.52s
Timp de răspuns (total)	31.96s	18.24s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

none

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	4.9	10.0	25.0%	0		844ms	645	903	0
Mercury 2	3.0	10.0	0.0%	0		483ms	631	286	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	4.5	10.0	0.0%	0		775ms	8,344	525	0
Mercury 2	3.4	9.6	0.0%	0		1.03s	7,229	3,088	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.0	10.0	0.0%	0		9.28s	86,631	3,481	0
Mercury 2	3.0	10.0	0.0%	0		2.56s	65,412	5,256	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.0	10.0	0.0%	0		575ms	7,617	195	0
Mercury 2	7.3	5.9	83.3%	1		667ms	6,362	180	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.0	10.0	0.0%	0		357ms	768	24	0
Mercury 2	5.3	7.2	44.4%	1		534ms	784	46	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	4.0	10.0	0.0%	0		499ms	528	115	0
Mercury 2	4.8	10.0	0.0%	0		628ms	495	159	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.6	9.9	0.0%	0		344ms	687	66	0
Mercury 2	6.5	10.0	50.0%	0		551ms	691	82	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.2	10.0	0.0%	0		608ms	672	432	0
Mercury 2	3.1	10.0	0.0%	0		535ms	694	251	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	10.0	10.0	100.0%	0		2.17s	7,719	243	0
Mercury 2	10.0	10.0	100.0%	0		1.27s	6,193	197	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Granite 4.1 8B	3.0	10.0	0.0%	0		306ms	216	12	0
Mercury 2	3.0	10.0	0.0%	0		548ms	213	19	0

Schimbă perechea de comparație