AI BENCHY Compare

Mistral: Mistral Small 4 vs OpenAI: GPT-5.4

Rezumat

Comparație benchmark Mistral Small 4 vs GPT-5.4: GPT-5.4 conduce la scorul mediu cu 5.8 vs 5.1. Mistral Small 4 are costul de benchmark mai mic, $0.068 vs $0.122. GPT-5.4 este mai rapid cu 1.42s vs 9.40s, cu rate de reușită de 44.4% vs 36.5%.

Model recomandat: GPT-5.4 - Are cel mai bun scor aici (5.8) și răspunde de aproximativ 6.6x mai rapid decât Mistral Small 4.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-12

Metrică	Mistral Small 4 Mistral Small 4 medium Lansare: 2026-03-16	GPT-5.4 GPT-5.4 none Lansare: 2026-03-05

Metrică	Mistral Small 4 Mistral Small 4 medium Lansare: 2026-03-16	GPT-5.4 GPT-5.4 none Lansare: 2026-03-05
Scor	5.1	5.8
Rang	#138	#116
Fiabilitate	10.0	10.0
Consistență	6.9	9.2
Teste corecte
Rată de trecere pe încercare	44.4%	36.5%
Teste instabile	8	2
Rulări totale	63	63
Cost per rezultat	1.344	1.740
Cost total	$0.068	$0.122
Preț de intrare	$0.150 / 1M	$2.500 / 1M
Preț de ieșire	$0.600 / 1M	$15.000 / 1M
Total tokenuri de intrare	42,576	34,212
Tokenuri de ieșire	24,184	2,417
Tokenuri de raționament	84,678	0
Timp de răspuns (mediu)	9.40s	1.42s
Timp de răspuns (maxim)	59.15s	2.95s
Timp de răspuns (total)	197.39s	29.87s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#138 Mistral Small 4

medium

Cost: $0.006
Time: 47.9s
Tokens: 9,857 tok

#116 GPT-5.4

none

Cost: $0.026
Time: 18.1s
Tokens: 1,792 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	5.6	3.8	66.7%	3		2.67s	708	4,055	4,778
GPT-5.4	3.2	8.0	8.3%	1		1.21s	606	406	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	4.4	5.1	33.3%	2		39.98s	7,636	11,635	54,715
GPT-5.4	5.5	10.0	33.3%	0		1.62s	7,305	516	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	3.0	10.0	0.0%	0		25.25s	18,706	2,612	10,700
GPT-5.4	3.0	10.0	0.0%	0		2.89s	11,019	291	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	7.3	5.9	83.3%	1		1.23s	6,171	335	723
GPT-5.4	10.0	10.0	100.0%	0		1.04s	7,140	222	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	5.3	7.2	44.4%	1		6.11s	742	2,621	6,904
GPT-5.4	5.3	7.2	44.4%	1		1.07s	723	50	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	4.8	10.0	0.0%	0		2.05s	519	821	828
GPT-5.4	4.4	9.9	0.0%	0		1.78s	477	184	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	7.3	5.8	83.3%	1		1.38s	729	540	1,031
GPT-5.4	6.5	10.0	50.0%	0		1.07s	660	81	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	3.4	9.7	0.0%	0		2.17s	735	1,226	2,632
GPT-5.4	5.6	9.8	33.3%	0		1.44s	642	381	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	10.0	10.0	100.0%	0		3.50s	6,420	321	810
GPT-5.4	10.0	10.0	100.0%	0		2.75s	5,445	246	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Mistral Small 4	3.0	10.0	0.0%	0		5.92s	210	18	1,557
GPT-5.4	3.0	10.0	0.0%	0		990ms	195	40	0

Comparație rapidă

Schimbă perechea de comparație

Mistral Small 4mediumvsMiMo-V2.5none Mistral Small 4mediumvsQwen3.5-9Bnone Mistral Small 4mediumvsQwen3 Coder Nextnone Mistral Small 4mediumvsQwen3.6 35B A3Bnone Trinity Large PreviewnonevsMistral Small 4medium Mistral Small 4mediumvsGPT-4o-mininone DeepSeek V3.2nonevsMistral Small 4medium Mistral Small 4mediumvsQwen3.5-122B-A10Bnone Mistral Small 4mediumvsGPT-5.4 Mininone Mistral Small 4mediumvsGrok 4.20none Mistral Small 4mediumvsGLM 5 Turbonone Mistral Small 4mediumvsGLM 4.7 Flashnone