AI BENCHY Compare

inclusionAI: Ling-2.6-1T vs Z.ai: GLM 4.7 Flash

Rezumat

Comparație benchmark Ling-2.6-1T vs GLM 4.7 Flash: GLM 4.7 Flash conduce la scorul mediu cu 4.4 vs 4.3. Ling-2.6-1T are costul de benchmark mai mic, $0.005 vs $0.054. Ling-2.6-1T este mai rapid cu 7.72s vs 35.10s, cu rate de reușită de 14.3% vs 33.3%.

Model recomandat: Ling-2.6-1T - Scorul rămâne aproape de cel mai bun scor de aici (4.3 vs 4.4) și costă de aproximativ 12.9x mai puțin decât GLM 4.7 Flash.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-04

Metrică	Ling-2.6-1T Ling-2.6-1T none Lansare: 2026-04-23	GLM 4.7 Flash GLM 4.7 Flash medium Lansare: 2026-01-19

Metrică	Ling-2.6-1T Ling-2.6-1T none Lansare: 2026-04-23	GLM 4.7 Flash GLM 4.7 Flash medium Lansare: 2026-01-19
Scor	4.3	4.4
Rang	#159	#158
Fiabilitate	N/D	6.7
Consistență	10.0	6.8
Teste corecte
Rată de trecere pe încercare	14.3%	33.3%
Teste instabile	0	8
Rulări totale	63	63
Cost per rezultat	0.000	1.337
Cost total	$0.005	$0.054
Preț de intrare	$0.075 / 1M	$0.060 / 1M
Preț de ieșire	$0.625 / 1M	$0.400 / 1M
Total tokenuri de intrare	34,905	37,206
Tokenuri de ieșire	2,434	43,754
Tokenuri de raționament	0	89,079
Timp de răspuns (mediu)	7.72s	35.10s
Timp de răspuns (maxim)	25.72s	174.55s
Timp de răspuns (total)	139.00s	456.24s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#159 Ling-2.6-1T

none

No showcase result has been generated for this model yet.

Cost: $0.000
Time: -
Tokens: 0 tok

#158 GLM 4.7 Flash

medium

Invalid SVG

Cost: $0.000
Time: 186.2s
Tokens: 12,112 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Ling-2.6-1T	3.4	10.0	0.0%	0		6.55s	726	777	0
GLM 4.7 Flash	4.7	5.9	41.7%	2		14.95s	555	1,122	6,110

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Ling-2.6-1T	3.8	10.0	0.0%	0		10.57s	813	381	0
GLM 4.7 Flash	3.2	7.4	11.1%	1		55.33s	3,106	4,981	22,387

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Ling-2.6-1T	3.0	10.0	0.0%	0		23.53s	9,030	183	0
GLM 4.7 Flash	2.8	2.1	33.3%	1		65.57s	17,185	2,585	20,648

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Ling-2.6-1T	10.0	10.0	100.0%	0		1.37s	8,313	285	0
GLM 4.7 Flash	6.3	10.0	50.0%	0		1.51s	7,107	584	2,755

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Ling-2.6-1T	3.0	10.0	0.0%	0		1.04s	810	27	0
GLM 4.7 Flash	3.5	4.4	33.3%	2		174.55s	643	33,000	25,394

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Ling-2.6-1T	5.0	10.0	0.0%	0		20.34s	540	140	0
GLM 4.7 Flash	3.6	9.7	0.0%	0		18.14s	318	18	2,138

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Ling-2.6-1T	6.4	10.0	50.0%	0		5.36s	732	81	0
GLM 4.7 Flash	6.2	5.8	66.7%	1		2.97s	636	388	2,181

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Ling-2.6-1T	3.1	10.0	0.0%	0		5.36s	729	131	0
GLM 4.7 Flash	2.9	7.2	11.1%	1		12.93s	521	781	5,255

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Ling-2.6-1T	3.0	10.0	0.0%	0		25.72s	13,212	429	0
GLM 4.7 Flash	10.0	10.0	100.0%	0		15.95s	6,949	224	1,014

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Ling-2.6-1T	3.0	10.0	0.0%	0		0ms	0	0	0
GLM 4.7 Flash	3.0	10.0	0.0%	0		11.13s	186	71	1,197

Comparație rapidă

Schimbă perechea de comparație

Ling-2.6-1TnonevsQwen3.5-9Bmedium Mercury 2nonevsGLM 4.7 Flashmedium Qwen3.5-9BnonevsGLM 4.7 Flashmedium Qwen3.6 35B A3BnonevsGLM 4.7 Flashmedium MiMo-V2-FlashnonevsGLM 4.7 Flashmedium Trinity Large PreviewnonevsGLM 4.7 Flashmedium GPT-5.4 NanononevsGLM 4.7 Flashmedium Granite 4.1 8BnonevsGLM 4.7 Flashmedium Ling-2.6-1TnonevsQwen3 Coder Nextmedium GPT-4o-mininonevsGLM 4.7 Flashmedium GPT-5.4 MininonevsGLM 4.7 Flashmedium MiMo-V2.5nonevsGLM 4.7 Flashmedium