Trinity Large Preview vs Qwen: Qwen3.5-9B

Trinity Large Preview mène au score moyen avec 4.8 vs 3.8. Trinity Large Preview a le coût de benchmark le plus bas avec $0.008 vs $0.036. Trinity Large Preview est plus rapide avec 2.98s vs 82.24s, avec des taux de réussite de 21.2% vs 25.8%.

Modèle recommandéTrinity Large PreviewIl obtient le meilleur score ici (4.8) tout en coûtant environ 4.6x moins que Qwen3.5-9B (medium).

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-07-22

Métrique	Trinity Large Preview Trinity Large Preview none Sortie: 2026-01-27	Qwen3.5-9B Qwen3.5-9B medium Sortie: 2026-03-02

Métrique	Trinity Large Preview Trinity Large Preview none Sortie: 2026-01-27	Qwen3.5-9B Qwen3.5-9B medium Sortie: 2026-03-02
Score	4.8	3.8
Rang	#192	#214
Fiabilité	10.0	5.0
Cohérence	8.9	8.1
Tests corrects
Taux de réussite par tentative	21.2%	25.8%
Tests instables	2	5
Exécutions totales	63	66
Coût par résultat	0.017	1.187
Coût total	$0.008	$0.036
Prix d'entrée	$0.243 / 1M	$0.100 / 1M
Prix de sortie	$0.243 / 1M	$0.150 / 1M
Total des jetons d'entrée	29,828	17,070
Jetons de sortie	2,169	29,045
Jetons de raisonnement	0	209,516
Temps de réponse (moy.)	2.98s	82.24s
Temps de réponse (max)	14.34s	226.38s
Temps de réponse (total)	56.57s	1315.88s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#192 Trinity Large Preview

none

No endpoints found for arcee-ai/trinity-large-preview:free.

Coût: $0.000
Temps: 0.0s
Tokens: 0 tok

#214 Qwen3.5-9B

medium

Coût: $0.001
Temps: 35.9s
Tokens: 3,030 tok

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Catégorie:

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	3.1	10.0	0.0%	0		2.07s	651	550	0
Qwen3.5-9B	5.1	5.8	50.0%	2		34.44s	369	2,621	12,411

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	3.7	7.7	11.1%	1		14.34s	738	397	0
Qwen3.5-9B	2.9	10.0	0.0%	0		100.88s	2,396	7,890	41,129

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	1.5	5.0	0.0%	0		8.91s	12,053	294	0
Qwen3.5-9B	3.0	10.0	0.0%	0		0ms	0	0	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	10.0	10.0	100.0%	0		3.26s	6,900	186	0
Qwen3.5-9B	3.6	5.6	33.3%	1		87.31s	4,722	1,383	32,113

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	5.3	10.0	33.3%	0		877ms	738	25	0
Qwen3.5-9B	3.6	7.2	22.2%	1		137.75s	295	11,549	48,475

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	4.5	10.0	0.0%	0		873ms	498	104	0
Qwen3.5-9B	2.8	1.6	33.3%	1		226.38s	180	0	30,695

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	3.5	10.0	0.0%	0		822ms	678	63	0
Qwen3.5-9B	6.5	10.0	50.0%	0		5.75s	381	491	1,824

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	3.6	7.7	11.1%	1		1.97s	669	265	0
Qwen3.5-9B	3.0	10.0	0.0%	0		32.27s	376	1,593	12,026

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	6,699	267	0
Qwen3.5-9B	10.0	10.0	100.0%	0		4.31s	8,283	444	1,149

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	3.0	10.0	0.0%	0		777ms	204	18	0
Qwen3.5-9B	3.0	10.0	0.0%	0		177.02s	68	3,074	29,694

Comparaison rapide

Changer la paire de comparaison