Trinity Large Preview vs Mistral: Mistral Small 4

Mistral Small 4 conduce la scorul mediu cu 5.1 vs 4.8. Trinity Large Preview are costul de benchmark mai mic, $0.008 vs $0.022. Mistral Small 4 este mai rapid cu 1.20s vs 2.98s, cu rate de reușită de 21.2% vs 25.8%.

Model recomandatMistral Small 4Are cel mai bun scor aici (5.1) și răspunde de aproximativ 2.5x mai rapid decât Trinity Large Preview.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-18

Metrică	Trinity Large Preview Trinity Large Preview none Lansare: 2026-01-27	Mistral Small 4 Mistral Small 4 none Lansare: 2026-03-16

Metrică	Trinity Large Preview Trinity Large Preview none Lansare: 2026-01-27	Mistral Small 4 Mistral Small 4 none Lansare: 2026-03-16
Scor	4.8	5.1
Rang	#179	#161
Fiabilitate	10.0	10.0
Consistență	8.9	9.6
Teste corecte
Rată de trecere pe încercare	21.2%	25.8%
Teste instabile	2	1
Rulări totale	63	66
Cost per rezultat	0.017	0.432
Cost total	$0.008	$0.022
Preț de intrare	$0.243 / 1M	$0.150 / 1M
Preț de ieșire	$0.243 / 1M	$0.600 / 1M
Total tokenuri de intrare	29,828	104,708
Tokenuri de ieșire	2,169	9,812
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	2.98s	1.20s
Timp de răspuns (maxim)	14.34s	13.16s
Timp de răspuns (total)	56.57s	26.38s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#179 Trinity Large Preview

none

No endpoints found for arcee-ai/trinity-large-preview:free.

Cost: $0.000
Timp: 0.0s
Tokenuri: 0 tok

#161 Mistral Small 4

none

Cost: $0.002
Timp: 10.4s
Tokenuri: 2,370 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	3.1	10.0	0.0%	0		2.07s	651	550	0
Mistral Small 4	3.4	7.9	16.7%	1		395ms	708	182	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	3.7	7.7	11.1%	1		14.34s	738	397	0
Mistral Small 4	3.7	9.7	0.0%	0		901ms	7,636	619	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	1.5	5.0	0.0%	0		8.91s	12,053	294	0
Mistral Small 4	3.0	10.0	0.0%	0		7.44s	79,039	8,107	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	10.0	10.0	100.0%	0		3.26s	6,900	186	0
Mistral Small 4	10.0	10.0	100.0%	0		822ms	7,914	261	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	5.3	10.0	33.3%	0		877ms	738	25	0
Mistral Small 4	5.3	10.0	33.3%	0		367ms	798	28	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	4.5	10.0	0.0%	0		873ms	498	104	0
Mistral Small 4	4.0	10.0	0.0%	0		729ms	519	205	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	3.5	10.0	0.0%	0		822ms	678	63	0
Mistral Small 4	6.5	10.0	50.0%	0		380ms	729	69	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	3.6	7.7	11.1%	1		1.97s	669	265	0
Mistral Small 4	3.1	9.9	0.0%	0		399ms	735	111	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	6,699	267	0
Mistral Small 4	10.0	10.0	100.0%	0		1.40s	6,420	213	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	3.0	10.0	0.0%	0		777ms	204	18	0
Mistral Small 4	3.0	10.0	0.0%	0		397ms	210	17	0

Comparație rapidă

Schimbă perechea de comparație

Trinity Large PreviewnonevsQwen3 Coder Nextmedium Trinity Large PreviewnonevsCobuddymedium MiniMax M2.7mediumvsMistral Small 4none Trinity Large PreviewnonevsMiniMax M2.5medium KAT-Coder-Air V2.5lowvsMistral Small 4none Trinity Large PreviewnonevsMiniMax M2.7medium Trinity Large PreviewnonevsMistral Small 4medium KAT-Coder-Air V2.5mediumvsMistral Small 4none Trinity Large PreviewnonevsGLM 4.7 Flashmedium Mistral Small 4nonevsQwen3 Coder Nextmedium CobuddymediumvsMistral Small 4none KAT-Coder-Air V2.5highvsMistral Small 4none