AI BENCHY Compare

Trinity Large Preview vs Qwen: Qwen3.5-122B-A10B

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-03

Metrică	Trinity Large Preview Trinity Large Preview none Lansare: 2026-01-27	Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Lansare: 2026-02-24

Metrică	Trinity Large Preview Trinity Large Preview none Lansare: 2026-01-27	Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Lansare: 2026-02-24
Scor	4.7	5.4
Rang	#148	#131
Fiabilitate	10.0	10.0
Consistență	9.3	9.5
Teste corecte
Rată de trecere pe încercare	23.3%	33.3%
Teste instabile	2	1
Rulări totale	60	60
Cost per rezultat	0.017	0.380
Cost total	$0.008	$0.019
Preț de intrare	$0.243 / 1M	$0.260 / 1M
Preț de ieșire	$0.243 / 1M	$2.080 / 1M
Total tokenuri de intrare	29,828	44,894
Tokenuri de ieșire	2,169	3,374
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	2.98s	3.38s
Timp de răspuns (maxim)	14.34s	46.00s
Timp de răspuns (total)	56.57s	67.55s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	3.1	10.0	0.0%	0		2.07s	651	550	0
Qwen3.5-122B-A10B	4.8	10.0	25.0%	0		1.59s	696	312	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	4.0	6.6	16.7%	1		14.34s	738	397	0
Qwen3.5-122B-A10B	4.0	5.5	33.3%	1		2.14s	5,072	684	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	3.0	10.0	0.0%	0		8.91s	12,053	294	0
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		46.00s	20,175	1,137	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	10.0	10.0	100.0%	0		3.26s	6,900	186	0
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		1.01s	7,794	243	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	5.3	10.0	33.3%	0		877ms	738	25	0
Qwen3.5-122B-A10B	5.3	10.0	33.3%	0		465ms	789	15	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	4.5	10.0	0.0%	0		873ms	498	104	0
Qwen3.5-122B-A10B	5.0	10.0	0.0%	0		1.12s	522	66	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	3.5	10.0	0.0%	0		822ms	678	63	0
Qwen3.5-122B-A10B	6.3	10.0	50.0%	0		513ms	711	69	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	3.6	7.7	11.1%	1		1.97s	669	265	0
Qwen3.5-122B-A10B	3.8	10.0	0.0%	0		1.00s	714	575	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	6,699	267	0
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		2.04s	8,211	264	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Trinity Large Preview	3.0	10.0	0.0%	0		777ms	204	18	0
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		295ms	210	9	0

Comparație rapidă

Schimbă perechea de comparație

Trinity Large PreviewnonevsQwen3 Coder Nextmedium Mistral Small 4mediumvsQwen3.5-122B-A10Bnone MiniMax M2.7mediumvsQwen3.5-122B-A10Bnone Elephant AlphamediumvsQwen3.5-122B-A10Bnone MiniMax M2.5mediumvsQwen3.5-122B-A10Bnone Trinity Large PreviewnonevsGLM 4.7 Flashmedium CobuddymediumvsQwen3.5-122B-A10Bnone Trinity Large PreviewnonevsQwen3.5-9Bmedium Owl AlphamediumvsQwen3.5-122B-A10Bnone Trinity Large PreviewnonevsElephant Alphamedium gpt-oss-120bmediumDisponibil gratuitvsQwen3.5-122B-A10Bnone Nemotron 3 SupermediumDisponibil gratuitvsQwen3.5-122B-A10Bnone