Navegación
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs Google: Gemini 3 Flash Preview

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-08

Métrica Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite medium Lanzamiento: 2026-05-08 Gemini 3 Flash Preview Gemini 3 Flash Preview medium Lanzamiento: 2025-12-17
Puntuación 7.9 10.0
Rango #27 #1
Fiabilidad 10.0 10.0
Consistencia 9.1 10.0
Pruebas correctas
Tasa de aciertos por intento 71.9% 100.0%
Pruebas inestables 2 0
Ejecuciones totales 57 57
Costo por resultado 0.452 1.722
Costo total $0.059 $0.328
Precio de entrada $0.250 / 1M $0.500 / 1M
Precio de salida $1.500 / 1M $3.000 / 1M
Tokens de salida 2,224 1,985
Tokens de razonamiento 32,034 102,122
Tiempo de respuesta (promedio) 3.14s 11.43s
Tiempo de respuesta (máximo) 10.87s 74.66s
Tiempo de respuesta (total) 59.62s 217.10s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 9.1 10.0 75.0% 0 2.39s 604 4,201
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.88s 330 3,216
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 3.26s 429 2,712
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 74.66s 432 48,771
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 10.87s 327 7,401
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 22.42s 351 10,485
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 2.60s 279 2,845
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.43s 279 4,893
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 3.16s 15 5,165
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 15.27s 12 21,684
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 2.60s 84 1,142
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.19s 72 1,905
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 9.9 10.0 100.0% 0 2.59s 75 3,320
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.04s 72 2,709
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 7.6 7.2 77.8% 1 1.95s 165 2,450
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.48s 192 4,647
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 4.55s 234 921
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 12.60s 234 1,487
Cultura general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 3.08s 12 1,877
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.50s 11 2,325

Comparación rápida

Cambiar par de comparación