AI BENCHY Compare
Inception: Mercury 2 vs OpenAI: GPT-5.4
Benchmarks générés à partir des suites de tests AI BENCHY le: 2026-04-16
| Métrique | Mercury 2 Mercury 2 medium | GPT-5.4 GPT-5.4 none |
|---|---|---|
| Score | 6.5 | 5.9 |
| Rang | #53 | #65 |
| Cohérence | 8.6 | 9.1 |
| Tests corrects | ||
| Taux de réussite par tentative | 53.7% | 42.6% |
| Tests instables | 3 | 2 |
| Exécutions totales | 54 | 54 |
| Coût par résultat | 0.580 | 1.477 |
| Coût total | $0.047 | $0.104 |
| Prix d'entrée | $0.250 / 1M | $2.500 / 1M |
| Prix de sortie | $0.750 / 1M | $15.000 / 1M |
| Jetons de sortie | 3,972 | 2,317 |
| Jetons de raisonnement | 48,333 | 0 |
| Temps de réponse (moy.) | 2.21s | 1.51s |
| Temps de réponse (max) | 14.63s | 2.95s |
| Temps de réponse (total) | 37.51s | 27.21s |
Score vs coût total
Temps de réponse (moy.)
Score vs Temps de réponse (moy.)
Total des jetons de sortie
Score vs Total des jetons de sortie
Répartition par catégorie
Comparaison rapide
Changer la paire de comparaison
Mercury 2mediumvsMiMo-V2-OmninoneMercury 2mediumvsGLM 5noneMiniMax M2.5mediumDisponible gratuitementvsGPT-5.4noneMistral Small 4mediumvsGPT-5.4noneMercury 2mediumvsQwen3.5 Plus 2026-02-15noneMercury 2mediumvsGLM 5V TurbononeMercury 2mediumvsQwen3.5-FlashnoneGemma 4 26B A4BnoneDisponible gratuitementvsMercury 2mediumSeed-2.0-LitenonevsMercury 2mediumGemini 2.5 FlashnonevsMercury 2mediumMercury 2mediumvsQwen3.5-35B-A3BnoneDeepSeek V3.2nonevsMercury 2medium