AI BENCHY Compare

Laguna Xs.2 vs Qwen: Qwen3.6 Flash

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-30

Metrică	Laguna Xs.2 Laguna Xs.2 medium Lansare: 2026-04-28 Disponibil gratuit	Qwen3.6 Flash Qwen3.6 Flash none Lansare: 2026-04-20

Metrică	Laguna Xs.2 Laguna Xs.2 medium Lansare: 2026-04-28 Disponibil gratuit	Qwen3.6 Flash Qwen3.6 Flash none Lansare: 2026-04-20
Scor	6.2	5.8
Rang	#80	#93
Fiabilitate	10.0	10.0
Consistență	6.9	10.0
Teste corecte
Rată de trecere pe încercare	57.4%	38.9%
Teste instabile	7	0
Rulări totale	54	54
Cost per rezultat	0.000	0.250
Cost total	$0.000	$0.018
Preț de intrare	$0.000 / 1M	$0.250 / 1M
Preț de ieșire	$0.000 / 1M	$1.500 / 1M
Tokenuri de ieșire	58,141	4,161
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	6.03s	1.65s
Timp de răspuns (maxim)	29.11s	4.60s
Timp de răspuns (total)	108.59s	29.78s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Laguna Xs.2	7.4	5.9	83.3%	2		2.60s	5,283	0
Qwen3.6 Flash	3.1	10.0	0.0%	0		1.63s	1,554	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Laguna Xs.2	6.3	3.7	33.3%	1		14.36s	7,896	0
Qwen3.6 Flash	10.0	10.0	100.0%	0		2.23s	867	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Laguna Xs.2	3.0	10.0	0.0%	0		15.92s	8,501	0
Qwen3.6 Flash	3.0	10.0	0.0%	0		4.22s	315	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Laguna Xs.2	7.1	5.6	83.3%	1		9.34s	10,472	0
Qwen3.6 Flash	10.0	10.0	100.0%	0		2.13s	243	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Laguna Xs.2	4.1	4.4	44.5%	2		11.12s	18,712	0
Qwen3.6 Flash	5.3	10.0	33.3%	0		1.11s	15	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Laguna Xs.2	4.1	10.0	0.0%	0		2.76s	1,421	0
Qwen3.6 Flash	10.0	10.0	100.0%	0		947ms	132	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Laguna Xs.2	10.0	10.0	100.0%	0		1.68s	1,517	0
Qwen3.6 Flash	6.3	10.0	50.0%	0		1.10s	66	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Laguna Xs.2	5.3	10.0	33.3%	0		2.12s	3,168	0
Qwen3.6 Flash	3.5	10.0	0.0%	0		1.20s	697	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Laguna Xs.2	4.7	1.6	66.7%	1		3.39s	1,171	0
Qwen3.6 Flash	10.0	10.0	100.0%	0		2.49s	272	0

Comparație rapidă

Schimbă perechea de comparație

Gemini 2.5 FlashnonevsLaguna Xs.2mediumDisponibil gratuit Seed-2.0-LitenonevsLaguna Xs.2mediumDisponibil gratuit Gemma 4 26B A4BnoneDisponibil gratuitvsLaguna Xs.2mediumDisponibil gratuit Laguna Xs.2mediumDisponibil gratuitvsQwen3.5-35B-A3Bnone Laguna Xs.2mediumDisponibil gratuitvsQwen3.5-Flashnone Laguna Xs.2mediumDisponibil gratuitvsGLM 5V Turbonone gpt-oss-120bmediumDisponibil gratuitvsQwen3.6 Flashnone DeepSeek V4 PrononevsLaguna Xs.2mediumDisponibil gratuit MiniMax M2.5mediumDisponibil gratuitvsQwen3.6 Flashnone Laguna Xs.2mediumDisponibil gratuitvsQwen3.6 27Bnone Mistral Small 4mediumvsQwen3.6 Flashnone DeepSeek V3.2nonevsLaguna Xs.2mediumDisponibil gratuit