AI BENCHY Compare

Trinity Large Preview vs DeepSeek: DeepSeek V3.2

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-06-03

Métrique	Trinity Large Preview Trinity Large Preview none Sortie: 2026-01-27	DeepSeek V3.2 DeepSeek V3.2 none Sortie: 2025-12-01

Métrique	Trinity Large Preview Trinity Large Preview none Sortie: 2026-01-27	DeepSeek V3.2 DeepSeek V3.2 none Sortie: 2025-12-01
Score	4.7	5.4
Rang	#148	#130
Fiabilité	10.0	10.0
Cohérence	9.3	7.5
Tests corrects
Taux de réussite par tentative	23.3%	41.7%
Tests instables	2	6
Exécutions totales	60	60
Coût par résultat	0.017	0.296
Coût total	$0.008	$0.017
Prix d'entrée	$0.243 / 1M	$0.229 / 1M
Prix de sortie	$0.243 / 1M	$0.344 / 1M
Total des jetons d'entrée	29,828	53,408
Jetons de sortie	2,169	11,159
Jetons de raisonnement	0	0
Temps de réponse (moy.)	2.98s	14.43s
Temps de réponse (max)	14.34s	115.89s
Temps de réponse (total)	56.57s	288.55s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	3.1	10.0	0.0%	0		2.07s	651	550	0
DeepSeek V3.2	3.2	8.0	8.3%	1		9.35s	494	1,073	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	4.0	6.6	16.7%	1		14.34s	738	397	0
DeepSeek V3.2	3.1	5.4	16.7%	1		20.87s	4,690	4,522	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	3.0	10.0	0.0%	0		8.91s	12,053	294	0
DeepSeek V3.2	6.5	10.0	0.0%	0		115.89s	29,843	2,887	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	10.0	10.0	100.0%	0		3.26s	6,900	186	0
DeepSeek V3.2	6.3	5.8	66.7%	1		9.42s	7,890	1,710	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	5.3	10.0	33.3%	0		877ms	738	25	0
DeepSeek V3.2	2.9	7.2	11.1%	1		4.17s	624	21	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	4.5	10.0	0.0%	0		873ms	498	104	0
DeepSeek V3.2	4.7	1.6	66.7%	1		9.32s	314	43	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	3.5	10.0	0.0%	0		822ms	678	63	0
DeepSeek V3.2	10.0	10.0	100.0%	0		1.52s	627	66	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	3.6	7.7	11.1%	1		1.97s	669	265	0
DeepSeek V3.2	7.6	7.2	77.8%	1		6.91s	424	298	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	6,699	267	0
DeepSeek V3.2	10.0	10.0	100.0%	0		11.85s	8,319	522	0

Culture générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons d'entrée	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	3.0	10.0	0.0%	0		777ms	204	18	0
DeepSeek V3.2	3.0	10.0	0.0%	0		17.23s	183	17	0

Comparaison rapide

Changer la paire de comparaison

Trinity Large PreviewnonevsQwen3 Coder Nextmedium DeepSeek V3.2nonevsMistral Small 4medium DeepSeek V3.2nonevsMiniMax M2.7medium DeepSeek V3.2nonevsMiniMax M2.5medium DeepSeek V3.2nonevsElephant Alphamedium Trinity Large PreviewnonevsGLM 4.7 Flashmedium CobuddymediumvsDeepSeek V3.2none Trinity Large PreviewnonevsQwen3.5-9Bmedium DeepSeek V3.2nonevsOwl Alphamedium DeepSeek V3.2nonevsgpt-oss-120bmediumDisponible gratuitement Trinity Large PreviewnonevsElephant Alphamedium DeepSeek V3.2nonevsNemotron 3 SupermediumDisponible gratuitement