Navigation
AI BENCHY
Comparer Graphiques Méthodologie
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Trinity Large Preview

Comparer:

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-03-06

Métrique Anthropic: Claude Opus 4.6 medium Sortie: 2026-02-05 Trinity Large Preview none Sortie: 2026-01-27 Disponible gratuitement
Rang #26 #45
Score moy. 6.6 4.2
Cohérence 9.0 9.6
Coût par résultat 13.118 0.000
Coût total $1.312 $0.000
Tests corrects
Taux de réussite par tentative 66.7% 33.3%
Tests instables 2 1
Exécutions totales 48 48
Jetons de sortie 26,254 1,837
Jetons de raisonnement 17,363 0
Temps de réponse (moy.) 22.86s 3.15s
Temps de réponse (max) 83.40s 8.91s
Temps de réponse (total) 205.71s 50.46s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score moy. vs Temps de réponse (moy.)

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Anthropic: Claude Opus 4.6 4.0 4.4 55.6% 2 11.88s 897 1,000
Trinity Large Preview 10.0 10.0 0.0% 0 3.59s 587 0
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Anthropic: Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
Trinity Large Preview 10.0 10.0 0.0% 0 8.91s 294 0
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Anthropic: Claude Opus 4.6 9.9 10.0 100.0% 0 7.37s 691 757
Trinity Large Preview 9.9 10.0 100.0% 0 3.26s 186 0
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Anthropic: Claude Opus 4.6 10.0 10.0 0.0% 0 83.40s 14,642 8,687
Trinity Large Preview 4.0 10.0 33.3% 0 877ms 25 0
Intelligence générale Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Anthropic: Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
Trinity Large Preview 3.0 9.9 0.0% 0 2.86s 124 0
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Anthropic: Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
Trinity Large Preview 3.5 6.7 16.7% 1 1.09s 63 0
Puzzle Solving Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Anthropic: Claude Opus 4.6 7.0 10.0 66.7% 0 4.60s 531 637
Trinity Large Preview 4.0 10.0 33.3% 0 3.30s 291 0
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Anthropic: Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0

Comparaison rapide

Changer la paire de comparaison