Navegación
AI BENCHY
Comparar Gráficos
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Google: Gemini 2.5 Flash vs Inception: Mercury 2

Comparar:

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-05

Métrica Google: Gemini 2.5 Flash none Lanzamiento: 2025-06-17 Inception: Mercury 2 medium Lanzamiento: 2026-02-24
Rango #37 #35
Puntaje prom. 5.2 5.4
Pruebas correctas
Consistencia 9.0 8.3
Costo por resultado 0.185 0.622
Costo total $0.012 $0.044
Tasa de aciertos por intento 46.7% 57.8%
Pruebas inestables 2 3
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
Tokens de salida 1,192 3,571
Tokens de razonamiento 0 45,379
Tiempo de respuesta (promedio) 944ms 2.47s
Tiempo de respuesta (máximo) 4.39s 14.63s
Tiempo de respuesta (total) 14.16s 34.56s

Mejores modelos por puntuación

Tiempo de respuesta (promedio)

Puntuación vs costo total

Puntaje prom. vs Tiempo de respuesta (promedio)

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Google: Gemini 2.5 Flash 10.0 10.0 0.0% 0 668ms 99 0
Inception: Mercury 2 7.3 9.8 66.7% 0 1.30s 2,531 2,410
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Google: Gemini 2.5 Flash 10.0 10.0 0.0% 0 4.39s 366 0
Inception: Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Google: Gemini 2.5 Flash 9.9 10.0 100.0% 0 652ms 279 0
Inception: Mercury 2 5.5 5.9 83.3% 1 1.11s 183 1,656
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Google: Gemini 2.5 Flash 4.0 7.2 55.6% 1 495ms 12 0
Inception: Mercury 2 10.0 7.2 11.1% 1 6.48s 41 30,754
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Google: Gemini 2.5 Flash 9.0 6.8 66.7% 1 672ms 70 0
Inception: Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
Puzzle Solving Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Google: Gemini 2.5 Flash 4.7 10.0 33.3% 0 576ms 132 0
Inception: Mercury 2 1.7 7.5 22.2% 1 934ms 354 2,758
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Google: Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.91s 234 0
Inception: Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956

Comparación rápida

Cambiar par de comparación