Navigation
AI BENCHY
Comparer Graphiques Méthodologie
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs OpenAI: GPT-5.4

Comparer:

Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-03-06

Métrique Anthropic: Claude Opus 4.6 medium Sortie: 2026-02-05 OpenAI: GPT-5.4 none Sortie: 2026-03-05
Score moy. 6.4 4.6
Rang #31 #45
Tests corrects
Cohérence 8.9 8.9
Coût par résultat 14.411 1.496
Coût total $1.297 $0.090
Taux de réussite par tentative 64.4% 44.4%
Tests instables 2 2
common.totalRuns 45 (15 x 3) 45 (15 x 3)
Jetons de sortie 26,066 1,635
Jetons de raisonnement 17,071 0
Temps de réponse (moy.) 25.08s 1.46s
Temps de réponse (max) 83.40s 2.89s
Temps de réponse (total) 200.67s 21.86s

Meilleurs modèles par score

Score vs coût total

Temps de réponse (moy.)

Score moy. vs Temps de réponse (moy.)

Répartition par catégorie

Astuces anti-IA Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Anthropic: Claude Opus 4.6 4.0 4.4 55.6% 2 11.88s 897 1,000
OpenAI: GPT-5.4 10.0 7.3 11.1% 1 1.41s 388 0
Combiné Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Anthropic: Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
OpenAI: GPT-5.4 10.0 10.0 0.0% 0 2.89s 291 0
Analyse et extraction des données Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Anthropic: Claude Opus 4.6 9.9 10.0 100.0% 0 7.37s 691 757
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 1.04s 222 0
Spécifique au domaine Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Anthropic: Claude Opus 4.6 10.0 10.0 0.0% 0 83.40s 14,642 8,687
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 1.07s 50 0
Suivi des instructions Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Anthropic: Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
OpenAI: GPT-5.4 5.5 10.0 50.0% 0 1.07s 81 0
Puzzle Solving Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Anthropic: Claude Opus 4.6 7.0 10.0 66.7% 0 4.60s 531 637
OpenAI: GPT-5.4 4.0 9.8 33.3% 0 1.52s 357 0
Appel d'outils Score Cohérence Taux de réussite par tentative Tests instables Tests corrects Temps de réponse (moy.) Jetons de sortie Jetons de raisonnement
Anthropic: Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0

Comparaison rapide

Changer la paire de comparaison