Qwen: Qwen3.5-9B vs xAI: Grok 4.20

Grok 4.20 conduce la scorul mediu cu 4.1 vs 3.8. Qwen3.5-9B (medium) are costul de benchmark mai mic, $0.036 vs $0.057. Grok 4.20 este mai rapid cu 1.11s vs 82.24s, cu rate de reușită de 25.8% vs 27.3%.

Model recomandatGrok 4.20Are cel mai bun scor aici (4.1) și răspunde de aproximativ 74.2x mai rapid decât Qwen3.5-9B (medium).

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-25

Rezumatul comparației

Rang: #220
Total tokenuri de ieșire: 238,561
Timp de răspuns (mediu): 82.24s
Cost total: $0.036

Rang: #213
Total tokenuri de ieșire: 1,923
Timp de răspuns (mediu): 1.11s
Cost total: $0.057

Comparație detaliată

Metrică	Qwen3.5-9B Qwen3.5-9B medium Lansare: 2026-03-02	Grok 4.20 Grok 4.20 none Lansare: 2026-03-31

Metrică	Qwen3.5-9B Qwen3.5-9B medium Lansare: 2026-03-02	Grok 4.20 Grok 4.20 none Lansare: 2026-03-31
Scor	3.8	4.1
Rang	#220	#213
Fiabilitate	5.0	N/D
Consistență	8.1	8.1
Teste corecte
Rată de trecere pe încercare	25.8%	27.3%
Teste instabile	5	0
Rulări totale	66	54
Cost per rezultat	1.187	1.570
Cost total	$0.036	$0.057
Preț de intrare	$0.100 / 1M	$1.250 / 1M
Preț de ieșire	$0.150 / 1M	$2.500 / 1M
Total tokenuri de intrare	17,070	41,313
Tokenuri de ieșire	29,045	1,923
Tokenuri de raționament	209,516	0
Timp de răspuns (mediu)	82.24s	1.11s
Timp de răspuns (maxim)	226.38s	6.04s
Timp de răspuns (total)	1315.88s	19.96s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#220 Qwen3.5-9B

medium

Cost: $0.001
Timp: 35.9s
Tokenuri: 3,030 tok

#213 xAI: Grok 4.20

none

Cost: $0.004
Timp: 6.5s
Tokenuri: 1,367 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-9B	5.1	5.8	50.0%	2		34.44s	369	2,621	12,411
Grok 4.20	4.8	10.0	25.0%	0		501ms	1,986	267	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-9B	2.9	10.0	0.0%	0		100.88s	2,396	7,890	41,129
Grok 4.20	1.1	3.1	0.0%	0		1.22s	1,074	312	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-9B	3.0	10.0	0.0%	0		0ms	0	0	0
Grok 4.20	1.5	5.0	0.0%	0		6.04s	17,673	282	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-9B	3.6	5.6	33.3%	1		87.31s	4,722	1,383	32,113
Grok 4.20	10.0	10.0	100.0%	0		522ms	7,749	207	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-9B	3.6	7.2	22.2%	1		137.75s	295	11,549	48,475
Grok 4.20	3.0	10.0	0.0%	0		687ms	1,746	325	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-9B	2.8	1.6	33.3%	1		226.38s	180	0	30,695
Grok 4.20	4.8	10.0	0.0%	0		659ms	819	83	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-9B	6.5	10.0	50.0%	0		5.75s	381	491	1,824
Grok 4.20	6.3	10.0	50.0%	0		445ms	1,350	60	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-9B	3.0	10.0	0.0%	0		32.27s	376	1,593	12,026
Grok 4.20	5.3	10.0	33.3%	0		473ms	1,671	198	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-9B	10.0	10.0	100.0%	0		4.31s	8,283	444	1,149
Grok 4.20	10.0	10.0	100.0%	0		4.63s	7,245	189	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5-9B	3.0	10.0	0.0%	0		177.02s	68	3,074	29,694
Grok 4.20	0.0	0.0	0.0%	0		0ms	0	0	0

Comparație rapidă

Schimbă perechea de comparație

gpt-oss-120bnoneDisponibil gratuitvsQwen3.5-9Bmedium Grok 4.20nonevsGLM 4.7 Flashmedium Granite 4.1 8BnonevsQwen3.5-9Bmedium MiniMax M2.5mediumvsGrok 4.20none CobuddymediumvsGrok 4.20none Qwen3 Coder NextmediumvsGrok 4.20none Laguna S 2.1noneDisponibil gratuitvsQwen3.5-9Bmedium Mercury 2nonevsQwen3.5-9Bmedium Laguna S 2.1lowDisponibil gratuitvsGrok 4.20none MiniMax M2.7mediumvsGrok 4.20none Trinity Large PreviewnonevsQwen3.5-9Bmedium KAT-Coder-Air V2.5nonevsQwen3.5-9Bmedium