Compară Grafice Metodologie

Limbă:

❤️ Made by XCS

AI BENCHY Compare

Trinity Large Preview vs Qwen: Qwen3.5-35B-A3B

Compară:

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-06

Metrică	Trinity Large Preview none Lansare: 2026-01-27 Disponibil gratuit	Qwen: Qwen3.5-35B-A3B none Lansare: 2026-02-24
Rang	#45	#42
Scor mediu	4.2	4.7
Consistență	9.6	8.6
Cost per rezultat	0.000	0.237
Cost total	$0.000	$0.015
Teste corecte
Rată de trecere pe încercare	33.3%	50.0%
Teste instabile	1	3
Rulări totale	48 (16 x 3)	48 (16 x 3)
Tokenuri de ieșire	1,837	3,756
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	3.15s	4.10s
Timp de răspuns (maxim)	8.91s	47.43s
Timp de răspuns (total)	50.46s	65.62s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor mediu vs Timp de răspuns (mediu)

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
Qwen: Qwen3.5-35B-A3B	10.0	7.2	22.2%	1		1.76s	569	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
Qwen: Qwen3.5-35B-A3B	10.0	10.0	0.0%	0		47.43s	1,833	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
Qwen: Qwen3.5-35B-A3B	9.9	10.0	100.0%	0		1.16s	243	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
Qwen: Qwen3.5-35B-A3B	7.0	10.0	66.7%	0		485ms	15	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
Qwen: Qwen3.5-35B-A3B	6.0	3.4	66.7%	1		1.19s	114	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
Qwen: Qwen3.5-35B-A3B	5.0	10.0	50.0%	0		809ms	63	0

Puzzle Solving	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
Qwen: Qwen3.5-35B-A3B	1.7	7.4	22.2%	1		1.34s	655	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
Qwen: Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		2.30s	264	0

Comparație rapidă

Schimbă perechea de comparație

MiniMax M2.5mediumvsQwen3.5-35B-A3Bnone gpt-oss-120bmediumDisponibil gratuitvsQwen3.5-35B-A3Bnone Trinity Large PreviewnoneDisponibil gratuitvsMiniMax M2.5medium Mercury 2mediumvsQwen3.5-35B-A3Bnone Trinity Large PreviewnoneDisponibil gratuitvsQwen3 Coder Nextmedium GPT-5 NanomediumvsQwen3.5-35B-A3Bnone Trinity Large PreviewnoneDisponibil gratuitvsgpt-oss-120bmediumDisponibil gratuit Trinity Large PreviewnoneDisponibil gratuitvsMercury 2medium Trinity Large PreviewnoneDisponibil gratuitvsGLM 4.7 Flashmedium GPT-5 MinimediumvsQwen3.5-35B-A3Bnone Trinity Large PreviewnoneDisponibil gratuitvsQwen3.5-35B-A3Bmedium Trinity Large PreviewnoneDisponibil gratuitvsGPT-5 Nanomedium