AI BENCHY Compare

Arcee AI: Trinity Large Preview vs Qwen: Qwen3 Coder Next

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-29

Metrică	Trinity Large Preview Trinity Large Preview none Lansare: 2026-01-27	Qwen3 Coder Next Qwen3 Coder Next none Lansare: 2026-02-03

Metrică	Trinity Large Preview Trinity Large Preview none Lansare: 2026-01-27	Qwen3 Coder Next Qwen3 Coder Next none Lansare: 2026-02-03
Scor	5.3	5.1
Rang	#102	#113
Fiabilitate	N/D	N/D
Consistență	9.6	9.7
Teste corecte
Rată de trecere pe încercare	29.6%	25.9%
Teste instabile	1	1
Rulări totale	52	54
Cost per rezultat	0.000	0.188
Cost total	$0.000	$0.008
Preț de intrare	$0.150 / 1M	$0.140 / 1M
Preț de ieșire	$0.450 / 1M	$0.800 / 1M
Tokenuri de ieșire	1,985	3,617
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	5.07s	10.18s
Timp de răspuns (maxim)	39.47s	45.14s
Timp de răspuns (total)	91.23s	122.13s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	3.0	10.0	0.0%	0		3.02s	593	0
Qwen3 Coder Next	3.6	10.0	0.0%	0		3.31s	1,321	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	6.3	10.0	0.0%	0		39.47s	142	0
Qwen3 Coder Next	7.3	3.7	66.7%	1		3.14s	585	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	3.0	10.0	0.0%	0		8.91s	294	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		45.14s	317	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	10.0	10.0	100.0%	0		3.26s	186	0
Qwen3 Coder Next	6.5	10.0	50.0%	0		1.32s	246	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	5.3	10.0	33.3%	0		877ms	25	0
Qwen3 Coder Next	5.3	10.0	33.3%	0		962ms	26	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	4.4	9.9	0.0%	0		2.86s	124	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		1.34s	152	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	4.1	6.7	16.7%	1		1.09s	63	0
Qwen3 Coder Next	4.8	10.0	0.0%	0		7.71s	63	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	5.4	10.0	33.3%	0		3.30s	291	0
Qwen3 Coder Next	3.2	10.0	0.0%	0		22.86s	652	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	255	0

Comparație rapidă

Schimbă perechea de comparație

Trinity Large PreviewnonevsMiniMax M2.7medium Trinity Large PreviewnonevsElephant Alphamedium Nemotron 3 Nano Omni 30b A3b ReasoningmediumDisponibil gratuitvsQwen3 Coder Nextnone Trinity Large PreviewnonevsNemotron 3 Nano Omni 30b A3b ReasoningmediumDisponibil gratuit Elephant AlphamediumvsQwen3 Coder Nextnone MiniMax M2.7mediumvsQwen3 Coder Nextnone Trinity Large PreviewnonevsMistral Small 4medium Trinity Large PreviewnonevsMiniMax M2.5mediumDisponibil gratuit Trinity Large Previewnonevsgpt-oss-120bmediumDisponibil gratuit Qwen3 Coder NextnonevsGLM 4.7 Flashmedium Mistral Small 4mediumvsQwen3 Coder Nextnone MiniMax M2.5mediumDisponibil gratuitvsQwen3 Coder Nextnone