AI BENCHY Compare

Mistral: Mistral Small 4 vs Qwen: Qwen3.5-9B

Rezumat

Comparație benchmark Mistral Small 4 vs Qwen3.5-9B: Mistral Small 4 conduce la scorul mediu cu 5.3 vs 4.2. Qwen3.5-9B are costul de benchmark mai mic, $0.036 vs $0.068. Mistral Small 4 este mai rapid cu 9.40s vs 82.24s, cu rate de reușită de 44.4% vs 27.0%.

Model recomandat: Mistral Small 4 - Are cel mai bun scor aici (5.3) și răspunde de aproximativ 8.7x mai rapid decât Qwen3.5-9B.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-10

Metrică	Mistral Small 4 Mistral Small 4 medium Lansare: 2026-03-16	Qwen3.5-9B Qwen3.5-9B medium Lansare: 2026-03-02

Metrică	Mistral Small 4 Mistral Small 4 medium Lansare: 2026-03-16	Qwen3.5-9B Qwen3.5-9B medium Lansare: 2026-03-02
Scor	5.3	4.2
Rang	#133	#162
Fiabilitate	10.0	6.7
Consistență	6.9	8.0
Teste corecte
Rată de trecere pe încercare	44.4%	27.0%
Teste instabile	8	5
Rulări totale	63	63
Cost per rezultat	1.344	1.187
Cost total	$0.068	$0.036
Preț de intrare	$0.150 / 1M	$0.100 / 1M
Preț de ieșire	$0.600 / 1M	$0.150 / 1M
Total tokenuri de intrare	42,576	17,070
Tokenuri de ieșire	24,184	29,045
Tokenuri de raționament	84,678	209,516
Timp de răspuns (mediu)	9.40s	82.24s
Timp de răspuns (maxim)	59.15s	226.38s
Timp de răspuns (total)	197.39s	1315.88s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#133 Mistral Small 4

medium

Cost: $0.006
Time: 47.9s
Tokens: 9,857 tok

#162 Qwen3.5-9B

medium

Cost: $0.001
Time: 35.9s
Tokens: 3,030 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	5.6	3.8	66.7%	3		2.67s	708	4,055	4,778
Qwen3.5-9B	5.1	5.8	50.0%	2		34.44s	369	2,621	12,411

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	4.4	5.1	33.3%	2		39.98s	7,636	11,635	54,715
Qwen3.5-9B	2.9	10.0	0.0%	0		100.88s	2,396	7,890	41,129

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	3.0	10.0	0.0%	0		25.25s	18,706	2,612	10,700
Qwen3.5-9B	3.0	10.0	0.0%	0		0ms	0	0	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	7.3	5.9	83.3%	1		1.23s	6,171	335	723
Qwen3.5-9B	3.6	5.6	33.3%	1		87.31s	4,722	1,383	32,113

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	5.3	7.2	44.4%	1		6.11s	742	2,621	6,904
Qwen3.5-9B	3.6	7.2	22.2%	1		137.75s	295	11,549	48,475

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	4.8	10.0	0.0%	0		2.05s	519	821	828
Qwen3.5-9B	2.8	1.6	33.3%	1		226.38s	180	0	30,695

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	7.3	5.8	83.3%	1		1.38s	729	540	1,031
Qwen3.5-9B	6.5	10.0	50.0%	0		5.75s	381	491	1,824

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	3.4	9.7	0.0%	0		2.17s	735	1,226	2,632
Qwen3.5-9B	3.0	10.0	0.0%	0		32.27s	376	1,593	12,026

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	10.0	10.0	100.0%	0		3.50s	6,420	321	810
Qwen3.5-9B	10.0	10.0	100.0%	0		4.31s	8,283	444	1,149

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	3.0	10.0	0.0%	0		5.92s	210	18	1,557
Qwen3.5-9B	3.0	10.0	0.0%	0		177.02s	68	3,074	29,694

Comparație rapidă

Schimbă perechea de comparație

Mistral Small 4mediumvsQwen3.5-122B-A10Bnone DeepSeek V3.2nonevsMistral Small 4medium Mistral Small 4mediumvsGLM 5 Turbonone Ling-2.6-1TnonevsQwen3.5-9Bmedium Mistral Small 4mediumvsKimi K2.5none Mistral Small 4mediumvsQwen3.6 Flashnone Granite 4.1 8BnonevsQwen3.5-9Bmedium Mistral Small 4mediumvsGrok 4.20none Mistral Small 4mediumvsgpt-oss-120bnoneDisponibil gratuit Mistral Small 4mediumvsGPT-5.4none Mistral Small 4mediumvsKimi K2.6noneDisponibil gratuit Mistral Small 4mediumvsMiMo-V2.5-Pronone