AI BENCHY Compare

Mistral: Mistral Small 4 vs Laguna Xs.2

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-29

Metrică	Mistral Small 4 Mistral Small 4 none Lansare: 2026-03-16	Laguna Xs.2 Laguna Xs.2 none Lansare: 2026-04-28 Disponibil gratuit

Metrică	Mistral Small 4 Mistral Small 4 none Lansare: 2026-03-16	Laguna Xs.2 Laguna Xs.2 none Lansare: 2026-04-28 Disponibil gratuit
Scor	5.2	5.0
Rang	#109	#118
Fiabilitate	N/D	9.9
Consistență	9.5	10.0
Teste corecte
Rată de trecere pe încercare	31.5%	27.8%
Teste instabile	1	0
Rulări totale	54	54
Cost per rezultat	0.118	0.000
Cost total	$0.006	$0.000
Preț de intrare	$0.150 / 1M	$0.000 / 1M
Preț de ieșire	$0.600 / 1M	$0.000 / 1M
Tokenuri de ieșire	2,207	3,824
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	665ms	1.68s
Timp de răspuns (maxim)	1.72s	16.04s
Timp de răspuns (total)	11.97s	30.26s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	3.4	7.9	16.7%	1		395ms	182	0
Laguna Xs.2	3.2	10.0	0.0%	0		743ms	933	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	4.5	9.0	0.0%	0		1.28s	583	0
Laguna Xs.2	2.5	10.0	0.0%	0		1.96s	866	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	3.0	10.0	0.0%	0		1.72s	496	0
Laguna Xs.2	3.0	10.0	0.0%	0		2.01s	521	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	10.0	10.0	100.0%	0		822ms	261	0
Laguna Xs.2	10.0	10.0	100.0%	0		646ms	246	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	5.3	10.0	33.3%	0		367ms	28	0
Laguna Xs.2	5.3	10.0	33.3%	0		371ms	33	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	4.0	10.0	0.0%	0		729ms	205	0
Laguna Xs.2	5.0	10.0	0.0%	0		16.04s	200	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	6.5	10.0	50.0%	0		380ms	69	0
Laguna Xs.2	6.5	10.0	50.0%	0		439ms	81	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	3.1	9.9	0.0%	0		589ms	170	0
Laguna Xs.2	5.4	10.0	33.3%	0		688ms	552	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	10.0	10.0	100.0%	0		1.40s	213	0
Laguna Xs.2	3.0	10.0	0.0%	0		1.93s	392	0

Comparație rapidă

Schimbă perechea de comparație

Mistral Small 4nonevsNemotron 3 Nano Omni 30b A3b ReasoningmediumDisponibil gratuit Mistral Small 4nonevsElephant Alphamedium MiniMax M2.7mediumvsMistral Small 4none Nemotron 3 Nano Omni 30b A3b ReasoningmediumDisponibil gratuitvsLaguna Xs.2noneDisponibil gratuit Elephant AlphamediumvsLaguna Xs.2noneDisponibil gratuit MiniMax M2.7mediumvsLaguna Xs.2noneDisponibil gratuit Laguna Xs.2noneDisponibil gratuitvsQwen3 Coder Nextmedium Laguna Xs.2noneDisponibil gratuitvsGLM 4.7 Flashmedium MiniMax M2.5mediumDisponibil gratuitvsMistral Small 4none Mistral Small 4nonevsQwen3 Coder Nextmedium Mistral Small 4mediumvsLaguna Xs.2noneDisponibil gratuit Mistral Small 4nonevsGLM 4.7 Flashmedium