AI BENCHY Compare

Poolside: Laguna XS 2.1 vs Z.ai: GLM 4.7 Flash

Rezumat

Comparație benchmark Laguna XS 2.1 vs GLM 4.7 Flash: Laguna XS 2.1 conduce la scorul mediu cu 5.3 vs 4.3. Laguna XS 2.1 are costul de benchmark mai mic, $0.003 vs $0.054. Laguna XS 2.1 este mai rapid cu 722ms vs 35.10s, cu rate de reușită de 31.8% vs 33.3%.

Model recomandat: Laguna XS 2.1 - Are cel mai bun scor aici (5.3) și costă de aproximativ 18.5x mai puțin decât GLM 4.7 Flash.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-02

Metrică	Laguna XS 2.1 Laguna XS 2.1 none Lansare: 2026-07-02 Disponibil gratuit	GLM 4.7 Flash GLM 4.7 Flash medium Lansare: 2026-01-19

Metrică	Laguna XS 2.1 Laguna XS 2.1 none Lansare: 2026-07-02 Disponibil gratuit	GLM 4.7 Flash GLM 4.7 Flash medium Lansare: 2026-01-19
Scor	5.3	4.3
Rang	#128	#162
Fiabilitate	10.0	6.7
Consistență	9.0	6.8
Teste corecte
Rată de trecere pe încercare	31.8%	33.3%
Teste instabile	3	8
Rulări totale	63	63
Cost per rezultat	0.058	1.337
Cost total	$0.003	$0.054
Preț de intrare	$0.060 / 1M	$0.060 / 1M
Preț de ieșire	$0.120 / 1M	$0.400 / 1M
Total tokenuri de intrare	41,148	37,206
Tokenuri de ieșire	3,451	43,754
Tokenuri de raționament	0	89,079
Timp de răspuns (mediu)	722ms	35.10s
Timp de răspuns (maxim)	2.30s	174.55s
Timp de răspuns (total)	15.17s	456.24s

Prezentare generare

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#128 Laguna XS 2.1

none

Cost: $0.001
Timp: 27.6s
Tokenuri: 4,344 tok

#162 GLM 4.7 Flash

medium

SVG invalid

Cost: $0.000
Timp: 186.2s
Tokenuri: 12,112 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Laguna XS 2.1	5.3	8.3	33.3%	1		755ms	774	1,015	0
GLM 4.7 Flash	4.7	5.9	41.7%	2		14.95s	555	1,122	6,110

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Laguna XS 2.1	4.3	7.8	22.2%	1		623ms	7,995	562	0
GLM 4.7 Flash	3.2	7.4	11.1%	1		55.33s	3,106	4,981	22,387

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Laguna XS 2.1	3.0	10.0	0.0%	0		1.76s	14,197	402	0
GLM 4.7 Flash	2.8	2.1	33.3%	1		65.57s	17,185	2,585	20,648

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Laguna XS 2.1	10.0	10.0	100.0%	0		768ms	7,734	240	0
GLM 4.7 Flash	6.3	10.0	50.0%	0		1.51s	7,107	584	2,755

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Laguna XS 2.1	5.3	10.0	33.3%	0		364ms	834	14	0
GLM 4.7 Flash	3.5	4.4	33.3%	2		174.55s	643	33,000	25,394

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Laguna XS 2.1	5.0	10.0	0.0%	0		529ms	537	128	0
GLM 4.7 Flash	3.6	9.7	0.0%	0		18.14s	318	18	2,138

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Laguna XS 2.1	3.8	5.8	33.3%	1		364ms	638	50	0
GLM 4.7 Flash	6.2	5.8	66.7%	1		2.97s	636	388	2,181

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Laguna XS 2.1	3.0	10.0	0.0%	0		1.01s	771	730	0
GLM 4.7 Flash	2.9	7.2	11.1%	1		12.93s	521	781	5,255

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Laguna XS 2.1	10.0	10.0	100.0%	0		1.36s	7,413	300	0
GLM 4.7 Flash	10.0	10.0	100.0%	0		15.95s	6,949	224	1,014

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Laguna XS 2.1	3.0	10.0	0.0%	0		254ms	255	10	0
GLM 4.7 Flash	3.0	10.0	0.0%	0		11.13s	186	71	1,197

Comparație rapidă

Schimbă perechea de comparație