AI BENCHY Compare

Modele comparate

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-30

Metrică	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Lansare: 2026-02-15	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Lansare: Data lansării necunoscută Disponibil gratuit	GLM 5 Turbo GLM 5 Turbo medium Lansare: 2026-03-15

Metrică	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Lansare: 2026-02-15	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Lansare: Data lansării necunoscută Disponibil gratuit	GLM 5 Turbo GLM 5 Turbo medium Lansare: 2026-03-15
Scor	8.4	8.5	8.0
Rang	#9	#6	#17
Consistență	9.0	10.0	7.9
Teste corecte
Rată de trecere pe încercare	82.4%	76.5%	76.5%
Teste instabile	2	0	5
Rulări totale	51	49	51
Cost per rezultat	1.448	0.000	1.509
Cost total	$0.189	$0.000	$0.166
Preț de intrare	$0.260 / 1M	$0.000 / 1M	$1.200 / 1M
Preț de ieșire	$1.560 / 1M	$0.000 / 1M	$4.000 / 1M
Tokenuri de ieșire	1,754	1,756	11,865
Tokenuri de raționament	92,522	77,213	35,632
Timp de răspuns (mediu)	39.13s	13.94s	17.98s
Timp de răspuns (maxim)	81.20s	43.55s	194.23s
Timp de răspuns (total)	391.29s	237.01s	305.72s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	8.2	7.9	83.3%	1		45.78s	205	21,236
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		9.90s	207	7,557
GLM 5 Turbo	10.0	10.0	100.0%	0		4.82s	362	3,137

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		46.85s	421	7,906
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		34.95s	452	13,073
GLM 5 Turbo	10.0	10.0	100.0%	0		13.88s	390	2,037

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		46.91s	270	14,916
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		14.95s	270	10,706
GLM 5 Turbo	10.0	10.0	100.0%	0		6.19s	577	3,632

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0		17.50s	35	16,680
Qwen3.6 Plus Preview	3.0	10.0	0.0%	0		22.08s	49	26,895
GLM 5 Turbo	2.9	4.4	22.2%	2		71.07s	9,665	19,279

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	4.7	1.6	66.7%	1		79.86s	73	8,675
Qwen3.6 Plus Preview	5.1	10.0	0.0%	0		27.05s	111	5,232
GLM 5 Turbo	6.1	3.1	66.7%	1		10.05s	60	2,216

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		31.93s	101	7,704
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		7.54s	102	5,552
GLM 5 Turbo	10.0	10.0	100.0%	0		5.38s	255	2,183

Puzzle Solving	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		34.57s	340	14,496
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		6.11s	298	6,868
GLM 5 Turbo	7.3	5.8	55.6%	2		5.44s	315	2,702

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		7.54s	309	909
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		5.87s	267	1,330
GLM 5 Turbo	10.0	10.0	100.0%	0		9.84s	241	446

Comparație rapidă

Schimbă perechea de comparație

Gemini 3.1 Flash Lite PreviewlowvsGLM 5 Turbomedium Gemini 3 Flash PreviewnonevsGLM 5 Turbomedium Gemini 3.1 Flash Lite PreviewnonevsGLM 5 Turbomedium GPT-5.2 ChatnonevsGLM 5 Turbomedium Gemini 3 Flash PreviewlowvsQwen3.6 Plus PreviewmediumDisponibil gratuit Gemini 3 Flash PreviewlowvsQwen3.5 Plus 2026-02-15medium Gemini 3.1 Flash Lite PreviewlowvsQwen3.5 Plus 2026-02-15medium Gemini 3 Flash PreviewnonevsQwen3.5 Plus 2026-02-15medium Gemini 3.1 Flash Lite PreviewlowvsQwen3.6 Plus PreviewmediumDisponibil gratuit Gemini 3 Flash PreviewnonevsQwen3.6 Plus PreviewmediumDisponibil gratuit GPT-5.3 ChatnonevsGLM 5 Turbomedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.5 Plus 2026-02-15medium