AI BENCHY Compare

Arcee AI: Trinity Large Preview vs OpenAI: GPT-5.4 Mini

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-04-29

Métrique	Trinity Large Preview Trinity Large Preview none Sortie: 2026-01-27	GPT-5.4 Mini GPT-5.4 Mini none Sortie: 2026-03-17

Métrique	Trinity Large Preview Trinity Large Preview none Sortie: 2026-01-27	GPT-5.4 Mini GPT-5.4 Mini none Sortie: 2026-03-17
Score	5.3	5.1
Rang	#102	#112
Fiabilité	N/D	N/D
Cohérence	9.6	8.6
Tests corrects
Taux de réussite par tentative	29.6%	35.2%
Tests instables	1	3
Exécutions totales	52	54
Coût par résultat	0.000	0.630
Coût total	$0.000	$0.032
Prix d'entrée	$0.150 / 1M	$0.750 / 1M
Prix de sortie	$0.450 / 1M	$4.500 / 1M
Jetons de sortie	1,985	2,418
Jetons de raisonnement	0	0
Temps de réponse (moy.)	5.07s	1.17s
Temps de réponse (max)	39.47s	2.52s
Temps de réponse (total)	91.23s	21.01s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	3.0	10.0	0.0%	0		3.02s	593	0
GPT-5.4 Mini	3.1	8.1	8.3%	1		929ms	654	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	6.3	10.0	0.0%	0		39.47s	142	0
GPT-5.4 Mini	10.0	10.0	100.0%	0		1.19s	333	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	3.0	10.0	0.0%	0		8.91s	294	0
GPT-5.4 Mini	3.0	10.0	0.0%	0		2.52s	298	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	10.0	10.0	100.0%	0		3.26s	186	0
GPT-5.4 Mini	10.0	10.0	100.0%	0		1.30s	222	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	5.3	10.0	33.3%	0		877ms	25	0
GPT-5.4 Mini	3.5	4.4	33.3%	2		937ms	88	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	4.4	9.9	0.0%	0		2.86s	124	0
GPT-5.4 Mini	4.8	10.0	0.0%	0		1.82s	174	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	4.1	6.7	16.7%	1		1.09s	63	0
GPT-5.4 Mini	6.3	10.0	50.0%	0		728ms	101	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	5.4	10.0	33.3%	0		3.30s	291	0
GPT-5.4 Mini	5.4	10.0	33.3%	0		860ms	293	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
GPT-5.4 Mini	3.0	10.0	0.0%	0		2.32s	255	0

Comparaison rapide

Changer la paire de comparaison

Trinity Large PreviewnonevsMiniMax M2.7medium Nemotron 3 Nano Omni 30b A3b ReasoningmediumDisponible gratuitementvsGPT-5.4 Mininone Trinity Large PreviewnonevsElephant Alphamedium GPT-5.4 MininonevsElephant Alphamedium Trinity Large PreviewnonevsNemotron 3 Nano Omni 30b A3b ReasoningmediumDisponible gratuitement MiniMax M2.7mediumvsGPT-5.4 Mininone Trinity Large PreviewnonevsMistral Small 4medium Trinity Large PreviewnonevsMiniMax M2.5mediumDisponible gratuitement GPT-5.4 MininonevsQwen3 Coder Nextmedium Trinity Large Previewnonevsgpt-oss-120bmediumDisponible gratuitement Mistral Small 4mediumvsGPT-5.4 Mininone GPT-5.4 MininonevsGLM 4.7 Flashmedium