AI BENCHY Compare

Arcee AI: Trinity Large Preview vs OpenAI: GPT-4o-mini

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-04-30

Métrique	Trinity Large Preview Trinity Large Preview none Sortie: 2026-01-27	GPT-4o-mini GPT-4o-mini none Sortie: 2024-07-18

Métrique	Trinity Large Preview Trinity Large Preview none Sortie: 2026-01-27	GPT-4o-mini GPT-4o-mini none Sortie: 2024-07-18
Score	5.2	5.1
Rang	#110	#119
Fiabilité	N/D	N/D
Cohérence	9.6	9.9
Tests corrects
Taux de réussite par tentative	29.6%	27.8%
Tests instables	1	0
Exécutions totales	52	54
Coût par résultat	0.000	0.098
Coût total	$0.000	$0.005
Prix d'entrée	$0.150 / 1M	$0.150 / 1M
Prix de sortie	$0.450 / 1M	$0.600 / 1M
Jetons de sortie	1,985	1,947
Jetons de raisonnement	0	0
Temps de réponse (moy.)	5.07s	2.00s
Temps de réponse (max)	39.47s	7.58s
Temps de réponse (total)	91.23s	21.99s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	3.0	10.0	0.0%	0		3.02s	593	0
GPT-4o-mini	4.8	10.0	25.0%	0		1.34s	186	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	6.3	10.0	0.0%	0		39.47s	142	0
GPT-4o-mini	3.0	8.7	0.0%	0		2.55s	347	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	3.0	10.0	0.0%	0		8.91s	294	0
GPT-4o-mini	3.0	10.0	0.0%	0		7.58s	568	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	10.0	10.0	100.0%	0		3.26s	186	0
GPT-4o-mini	10.0	10.0	100.0%	0		1.27s	183	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	5.3	10.0	33.3%	0		877ms	25	0
GPT-4o-mini	3.0	10.0	0.0%	0		637ms	15	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	4.4	9.9	0.0%	0		2.86s	124	0
GPT-4o-mini	4.0	10.0	0.0%	0		909ms	66	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	3.4	6.2	16.7%	1		1.09s	63	0
GPT-4o-mini	6.3	10.0	50.0%	0		1.27s	69	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	5.4	10.0	33.3%	0		3.30s	291	0
GPT-4o-mini	3.7	10.0	0.0%	0		1.30s	308	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
GPT-4o-mini	10.0	10.0	100.0%	0		2.51s	205	0

Comparaison rapide

Changer la paire de comparaison

Trinity Large PreviewnonevsElephant Alphamedium Trinity Large PreviewnonevsNemotron 3 Nano Omni 30b A3b ReasoningmediumDisponible gratuitement Trinity Large PreviewnonevsMiniMax M2.7medium Nemotron 3 Nano Omni 30b A3b ReasoningmediumDisponible gratuitementvsGPT-4o-mininone GPT-4o-mininonevsQwen3 Coder Nextmedium GPT-4o-mininonevsElephant Alphamedium MiniMax M2.7mediumvsGPT-4o-mininone Trinity Large PreviewnonevsQwen3 Coder Nextmedium Trinity Large PreviewnonevsMiniMax M2.5mediumDisponible gratuitement Trinity Large PreviewnonevsMistral Small 4medium GPT-4o-mininonevsGLM 4.7 Flashmedium MiniMax M2.5mediumDisponible gratuitementvsGPT-4o-mininone