AI BENCHY Compare

Qwen: Qwen3.6 27B vs xAI: Grok 4.1 Fast

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-27

Metrică	Qwen3.6 27B Qwen3.6 27B none Lansare: 2026-04-20	Grok 4.1 Fast Grok 4.1 Fast medium Lansare: 2025-11-19

Metrică	Qwen3.6 27B Qwen3.6 27B none Lansare: 2026-04-20	Grok 4.1 Fast Grok 4.1 Fast medium Lansare: 2025-11-19
Scor	6.0	6.7
Rang	#81	#69
Fiabilitate	10.0	N/D
Consistență	7.2	7.2
Teste corecte
Rată de trecere pe încercare	55.6%	64.8%
Teste instabile	6	6
Rulări totale	54	54
Cost per rezultat	0.433	0.613
Cost total	$0.031	$0.056
Preț de intrare	$0.500 / 1M	$0.200 / 1M
Preț de ieșire	$2.000 / 1M	$0.500 / 1M
Tokenuri de ieșire	3,775	2,010
Tokenuri de raționament	0	91,298
Timp de răspuns (mediu)	4.00s	23.88s
Timp de răspuns (maxim)	12.08s	121.79s
Timp de răspuns (total)	72.01s	262.66s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 27B	3.8	3.7	41.7%	3		2.83s	490	0
Grok 4.1 Fast	8.7	7.9	91.7%	1		3.81s	108	4,741

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 27B	10.0	10.0	100.0%	0		10.18s	505	0
Grok 4.1 Fast	2.3	1.1	33.3%	1		23.58s	821	6,703

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 27B	3.0	10.0	0.0%	0		9.95s	1,401	0
Grok 4.1 Fast	10.0	10.0	100.0%	0		37.64s	261	12,272

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 27B	7.3	5.8	83.3%	1		2.06s	248	0
Grok 4.1 Fast	10.0	10.0	100.0%	0		6.63s	180	5,409

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 27B	7.7	10.0	66.7%	0		3.03s	24	0
Grok 4.1 Fast	5.8	4.4	66.7%	2		121.79s	11	37,657

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 27B	5.2	9.9	0.0%	0		1.07s	72	0
Grok 4.1 Fast	4.2	9.9	0.0%	0		16.25s	127	3,456

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 27B	6.2	5.8	66.7%	1		1.92s	49	0
Grok 4.1 Fast	6.6	10.0	50.0%	0		5.30s	55	3,489

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 27B	5.3	7.2	44.4%	1		5.24s	647	0
Grok 4.1 Fast	5.3	7.2	44.4%	1		8.08s	187	6,086

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.6 27B	9.5	10.0	100.0%	0		6.74s	339	0
Grok 4.1 Fast	2.8	1.6	33.3%	1		27.71s	260	11,485

Comparație rapidă

Schimbă perechea de comparație

DeepSeek V4 PrononevsGrok 4.1 Fastmedium Grok 4.1 FastmediumvsGLM 5none GPT-5.5nonevsGrok 4.1 Fastmedium Qwen3.5 Plus 2026-02-15nonevsGrok 4.1 Fastmedium DeepSeek V4 ProhighvsGrok 4.1 Fastmedium gpt-oss-120bmediumDisponibil gratuitvsQwen3.6 27Bnone Grok 4.1 FastmediumvsMiMo-V2-Omninone GPT-5 NanomediumvsQwen3.6 27Bnone Gemma 4 31BnoneDisponibil gratuitvsGrok 4.1 Fastmedium MiniMax M2.5mediumDisponibil gratuitvsQwen3.6 27Bnone Mistral Small 4mediumvsQwen3.6 27Bnone Mercury 2mediumvsQwen3.6 27Bnone