AI BENCHY Compare
Inception: Mercury 2 vs Elephant
Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-04-14
| Métrica | Mercury 2 Mercury 2 medium | Elephant Elephant none |
|---|---|---|
| Puntuación | 6.5 | 5.2 |
| Rango | #51 | #81 |
| Consistencia | 8.6 | 9.6 |
| Pruebas correctas | ||
| Tasa de aciertos por intento | 53.7% | 31.5% |
| Pruebas inestables | 3 | 1 |
| Ejecuciones totales | 54 | 54 |
| Costo por resultado | 0.580 | 0.000 |
| Costo total | $0.047 | $0.000 |
| Precio de entrada | $0.250 / 1M | $0.000 / 1M |
| Precio de salida | $0.750 / 1M | $0.000 / 1M |
| Tokens de salida | 3,972 | 2,573 |
| Tokens de razonamiento | 48,333 | 0 |
| Tiempo de respuesta (promedio) | 2.21s | 1.23s |
| Tiempo de respuesta (máximo) | 14.63s | 3.81s |
| Tiempo de respuesta (total) | 37.51s | 22.16s |
Puntuación vs costo total
Tiempo de respuesta (promedio)
Puntuación vs Tiempo de respuesta (promedio)
Total de tokens de salida
Puntuación vs Total de tokens de salida
Desglose por categoría
Comparación rápida
Cambiar par de comparación
Mercury 2mediumvsMiMo-V2-OmninoneMiniMax M2.7mediumvsElephantnoneMercury 2mediumvsGLM 5noneMercury 2mediumvsQwen3.5 Plus 2026-02-15noneMercury 2mediumvsGLM 5V TurbononeMercury 2mediumvsQwen3.5-FlashnoneGemma 4 26B A4BnoneDisponible gratisvsMercury 2mediumSeed-2.0-LitenonevsMercury 2mediumGemini 2.5 FlashnonevsMercury 2mediumMercury 2mediumvsQwen3.5-35B-A3BnoneDeepSeek V3.2nonevsMercury 2mediumGemma 4 31BnoneDisponible gratisvsMercury 2medium