AI BENCHY Compare

Modele comparate

Rezumat

Comparație benchmark Qwen3.5 Plus 2026-02-15 vs Qwen3.6 Plus Preview vs GLM 5 TurboGLM 5 Turbo conduce la Scor cu 8.4. Qwen3.5 Plus 2026-02-15 conduce la Fiabilitate cu 10.0. Qwen3.6 Plus Preview are cel mai mic Cost total, $0.000. Qwen3.6 Plus Preview are cel mai rapid timp de răspuns, 15.25s.

Model recomandat: GLM 5 Turbo - Are cel mai bun scor aici (8.4) și răspunde de aproximativ 1.9x mai rapid decât celelalte modele din această comparație.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-18

Metrică	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Lansare: 2026-02-15	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Lansare: 2026-04-20 Disponibil gratuit	GLM 5 Turbo GLM 5 Turbo medium Lansare: 2026-03-15

Metrică	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Lansare: 2026-02-15	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Lansare: 2026-04-20 Disponibil gratuit	GLM 5 Turbo GLM 5 Turbo medium Lansare: 2026-03-15
Scor	8.0	5.8	8.4
Rang	#28	#113	#21
Fiabilitate	10.0	N/D	10.0
Consistență	8.8	9.0	8.5
Teste corecte
Rată de trecere pe încercare	73.0%	42.9%	74.6%
Teste instabile	3	0	4
Rulări totale	63	57	63
Cost per rezultat	2.445	0.000	2.011
Cost total	$0.310	$0.000	$0.323
Preț de intrare	$0.260 / 1M	$0.000 / 1M	$1.200 / 1M
Preț de ieșire	$1.560 / 1M	$0.000 / 1M	$4.000 / 1M
Total tokenuri de intrare	40,918	32,639	35,593
Tokenuri de ieșire	2,159	1,153	12,245
Tokenuri de raționament	189,604	62,197	62,277
Timp de răspuns (mediu)	73.79s	15.25s	23.00s
Timp de răspuns (maxim)	266.69s	43.55s	194.23s
Timp de răspuns (total)	1033.07s	182.96s	482.97s

Prezentare generare

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#28 Qwen3.5 Plus 2026-02-15

medium

Cost: $0.011
Timp: 125.5s
Tokenuri: 7,040 tok

#113 Qwen3.6 Plus Preview

medium

Nu s-a generat încă niciun rezultat de prezentare pentru acest model.

Cost: $0.000
Timp: -
Tokenuri: 0 tok

#21 GLM 5 Turbo

medium

Cost: $0.074
Timp: 206.0s
Tokenuri: 18,549 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	8.2	7.9	83.3%	1	45.78s	672	205	21,236
Qwen3.6 Plus Preview	8.3	10.0	75.0%	0	11.69s	501	61	5,812
GLM 5 Turbo	10.0	10.0	100.0%	0	4.82s	555	362	3,137

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	6.6	7.1	44.4%	1	180.70s	6,950	420	80,595
Qwen3.6 Plus Preview	9.8	3.3	0.0%	0	0ms	0	0	0
GLM 5 Turbo	8.2	9.3	66.7%	0	45.90s	5,941	363	25,381

Combinat	Scor	Consistență	Rată de trecere pe încercare	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	46.85s	14,934	421	7,906
Qwen3.6 Plus Preview	10.0	10.0	100.0%	34.95s	14,934	452	13,073
GLM 5 Turbo	10.0	10.0	100.0%	13.88s	12,714	390	2,037

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	46.91s	7,782	270	14,916
Qwen3.6 Plus Preview	10.0	10.0	100.0%	14.95s	7,782	270	10,706
GLM 5 Turbo	10.0	10.0	100.0%	6.19s	7,107	577	3,632

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0	17.50s	444	35	16,680
Qwen3.6 Plus Preview	3.0	10.0	0.0%	0	22.08s	665	49	26,895
GLM 5 Turbo	2.9	4.4	22.2%	2	71.07s	489	9,665	19,279

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	4.7	1.6	66.7%	1	79.86s	344	73	8,675
Qwen3.6 Plus Preview	3.0	10.0	0.0%	0	0ms	0	0	0
GLM 5 Turbo	6.1	3.1	66.7%	1	10.05s	477	60	2,216

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	31.93s	699	101	7,704
Qwen3.6 Plus Preview	6.5	10.0	50.0%	3.40s	381	27	1,383
GLM 5 Turbo	10.0	10.0	100.0%	5.38s	636	255	2,183

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0	32.50s	696	301	13,853
Qwen3.6 Plus Preview	5.3	10.0	33.3%	0	7.52s	183	27	2,998
GLM 5 Turbo	8.7	7.9	77.8%	1	5.23s	609	312	2,647

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	7.54s	8,193	309	909
Qwen3.6 Plus Preview	10.0	10.0	100.0%	5.87s	8,193	267	1,330
GLM 5 Turbo	10.0	10.0	100.0%	9.84s	6,879	241	446

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	103.81s	204	24	17,130
Qwen3.6 Plus Preview	3.0	10.0	0.0%	0ms	0	0	0
GLM 5 Turbo	3.0	10.0	0.0%	40.17s	186	20	1,319

Comparație rapidă

Schimbă perechea de comparație