Modele comparate

Model recomandat Grok 4.20 (medium)

Are cel mai puternic scor din această comparație (7.1) și cel mai bun echilibru între cost și timp de răspuns dintre toate cele 3 modele.

Comparație detaliată

Metrică	Grok 4.20 Grok 4.20 medium Lansare: 2026-03-31	Grok 4.20 Beta Grok 4.20 Beta medium Lansare: 2026-03-12	Grok 4.3 Grok 4.3 medium Lansare: 2026-05-01

Metrică	Grok 4.20 Grok 4.20 medium Lansare: 2026-03-31	Grok 4.20 Beta Grok 4.20 Beta medium Lansare: 2026-03-12	Grok 4.3 Grok 4.3 medium Lansare: 2026-05-01
Scor	7.1	6.0	7.1
Rang	#90	#152	#88
Fiabilitate	10.0	N/D	10.0
Consistență	8.5	7.8	8.6
Teste corecte
Rată de trecere pe încercare	63.6%	66.7%	68.2%
Teste instabile	4	1	4
Rulări totale	66	52	66
Cost per rezultat	9.709	4.505	5.990
Cost total	$0.777	$0.750	$0.779
Preț de intrare	$1.250 / 1M	$5.805 / 1M	$1.250 / 1M
Preț de ieșire	$2.500 / 1M	$5.805 / 1M	$2.500 / 1M
Total tokenuri de intrare	102,791	35,955	140,031
Tokenuri de ieșire	5,363	1,647	13,739
Tokenuri de raționament	253,977	91,565	227,682
Timp de răspuns (mediu)	29.47s	9.75s	47.45s
Timp de răspuns (maxim)	199.66s	31.36s	216.69s
Timp de răspuns (total)	648.35s	175.48s	1043.83s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

medium

medium

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Grok 4.20	8.2	7.9	83.3%	1	3.95s	2,010	287	8,312
Grok 4.20 Beta	8.7	7.9	91.7%	1	3.16s	2,010	268	7,583
Grok 4.3	10.0	10.0	100.0%	0	8.83s	2,010	88	8,207

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Grok 4.20	6.3	6.6	55.6%	1	109.93s	8,307	268	103,150
Grok 4.20 Beta	3.3	3.3	33.3%	0	31.36s	360	81	3,987
Grok 4.3	5.9	7.7	44.4%	1	41.23s	8,340	1,028	31,226

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Grok 4.20	8.7	6.9	83.3%	1	42.25s	71,267	3,776	44,009
Grok 4.20 Beta	5.0	5.0	50.0%	0	20.93s	12,909	227	12,212
Grok 4.3	6.5	10.0	50.0%	0	55.07s	108,468	11,992	21,601

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Grok 4.20	10.0	10.0	100.0%	4.17s	7,761	180	5,333
Grok 4.20 Beta	10.0	10.0	100.0%	4.01s	7,761	180	5,281
Grok 4.3	10.0	10.0	100.0%	18.97s	7,761	180	9,546

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Grok 4.20	5.3	10.0	33.3%	0	27.03s	1,764	375	49,339
Grok 4.20 Beta	5.3	10.0	33.3%	0	21.33s	1,764	251	40,255
Grok 4.3	5.3	7.2	44.4%	1	181.74s	1,764	14	111,300

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Grok 4.20	3.9	2.6	33.3%	1	24.48s	825	65	6,440
Grok 4.20 Beta	10.0	10.0	100.0%	0	5.78s	825	72	3,440
Grok 4.3	5.4	2.5	66.7%	1	24.70s	825	70	5,020

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Grok 4.20	9.8	10.0	100.0%	4.26s	1,362	57	6,419
Grok 4.20 Beta	9.8	10.0	100.0%	4.89s	1,362	57	7,123
Grok 4.3	9.8	10.0	100.0%	18.58s	1,362	57	8,713

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Grok 4.20	7.7	10.0	66.7%	0	6.22s	1,689	149	7,913
Grok 4.20 Beta	10.0	10.0	100.0%	0	3.52s	1,689	328	6,300
Grok 4.3	5.9	7.2	55.6%	1	22.52s	1,689	128	14,468

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Grok 4.20	3.0	10.0	0.0%	13.68s	7,275	197	6,620
Grok 4.20 Beta	3.0	10.0	0.0%	12.39s	7,275	183	5,384
Grok 4.3	10.0	10.0	100.0%	17.66s	7,263	168	4,615

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Grok 4.20	3.0	10.0	0.0%	63.48s	531	9	16,442
Grok 4.20 Beta	0.0	0.0	0.0%	0ms	0	0	0
Grok 4.3	3.0	10.0	0.0%	44.47s	549	14	12,986

Schimbă perechea de comparație