AI BENCHY Compare

Trinity Large Preview vs OpenAI: gpt-oss-120b

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-04-11

Métrique	Trinity Large Preview Trinity Large Preview none Sortie: 2026-01-27 Disponible gratuitement	gpt-oss-120b gpt-oss-120b none Sortie: 2025-08-05 Disponible gratuitement

Métrique	Trinity Large Preview Trinity Large Preview none Sortie: 2026-01-27 Disponible gratuitement	gpt-oss-120b gpt-oss-120b none Sortie: 2025-08-05 Disponible gratuitement
Score	5.3	5.2
Rang	#74	#79
Cohérence	9.6	7.9
Tests corrects
Taux de réussite par tentative	29.6%	38.9%
Tests instables	1	5
Exécutions totales	52	54
Coût par résultat	0.000	0.221
Coût total	$0.000	$0.009
Prix d'entrée	$0.000 / 1M	$0.039 / 1M
Prix de sortie	$0.000 / 1M	$0.190 / 1M
Jetons de sortie	1,985	44,652
Jetons de raisonnement	0	0
Temps de réponse (moy.)	5.07s	11.96s
Temps de réponse (max)	39.47s	68.97s
Temps de réponse (total)	91.23s	179.34s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score vs Temps de réponse (moy.)

Total des jetons de sortie

Score vs Total des jetons de sortie

Répartition par catégorie

Astuces anti-IA	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	3.0	10.0	0.0%	0		3.02s	593	0
gpt-oss-120b	6.6	8.0	58.3%	1		6.03s	4,867	0

Programmation	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	6.3	10.0	0.0%	0		39.47s	142	0
gpt-oss-120b	4.3	1.1	66.7%	1		9.57s	3,232	0

Combiné	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	3.0	10.0	0.0%	0		8.91s	294	0
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0

Analyse et extraction des données	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	10.0	10.0	100.0%	0		3.26s	186	0
gpt-oss-120b	6.5	10.0	50.0%	0		7.12s	598	0

Spécifique au domaine	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	5.3	10.0	33.3%	0		877ms	25	0
gpt-oss-120b	3.0	10.0	0.0%	0		34.98s	29,483	0

Intelligence générale	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	4.4	9.9	0.0%	0		2.86s	124	0
gpt-oss-120b	4.6	10.0	0.0%	0		2.83s	586	0

Suivi des instructions	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	4.1	6.7	16.7%	1		1.09s	63	0
gpt-oss-120b	8.4	6.9	83.3%	1		5.10s	1,982	0

Résolution d'énigmes	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	5.4	10.0	33.3%	0		3.30s	291	0
gpt-oss-120b	4.5	4.8	44.5%	2		6.86s	3,904	0

Appel d'outils	Score	Cohérence	Taux de réussite par tentative	Tests instables	Tests corrects	Temps de réponse (moy.)	Jetons de sortie	Jetons de raisonnement
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0

Comparaison rapide

Changer la paire de comparaison

Trinity Large PreviewnoneDisponible gratuitementvsMiniMax M2.7medium MiniMax M2.7mediumvsgpt-oss-120bnoneDisponible gratuitement Trinity Large PreviewnoneDisponible gratuitementvsMistral Small 4medium Trinity Large PreviewnoneDisponible gratuitementvsMiniMax M2.5mediumDisponible gratuitement Mistral Small 4mediumvsgpt-oss-120bnoneDisponible gratuitement gpt-oss-120bnoneDisponible gratuitementvsQwen3 Coder Nextmedium MiniMax M2.5mediumDisponible gratuitementvsgpt-oss-120bnoneDisponible gratuitement Trinity Large PreviewnoneDisponible gratuitementvsgpt-oss-120bmediumDisponible gratuitement gpt-oss-120bnoneDisponible gratuitementvsGLM 4.7 Flashmedium Trinity Large PreviewnoneDisponible gratuitementvsQwen3 Coder Nextmedium Trinity Large PreviewnoneDisponible gratuitementvsGLM 4.7 Flashmedium gpt-oss-120bnoneDisponible gratuitementvsQwen3.5-9Bmedium