Navegación
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Google: Gemini 3.5 Flash

Resumen

Comparación benchmark de Gemini 3.1 Pro Preview vs Gemini 3.5 Flash: Gemini 3.1 Pro Preview lidera en puntuación media con 9.2 vs 9.1. Gemini 3.5 Flash tiene menor coste de benchmark con $0.582 vs $1.054. Gemini 3.5 Flash es más rápido con 4.94s vs 20.14s, con tasas de acierto de 90.5% vs 87.3%.

Modelo recomendado: Gemini 3.5 Flash - Su puntuación se mantiene cerca de la mejor aquí (9.1 vs 9.2) y cuesta aproximadamente 1.8x menos que Gemini 3.1 Pro Preview.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-07-02

Métrica Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Lanzamiento: 2026-02-19 Gemini 3.5 Flash Gemini 3.5 Flash medium Lanzamiento: 2026-05-19
Puntuación 9.2 9.1
Rango #7 #8
Fiabilidad 10.0 10.0
Consistencia 10.0 9.6
Pruebas correctas
Tasa de aciertos por intento 90.5% 87.3%
Pruebas inestables 0 1
Ejecuciones totales 63 63
Costo por resultado 5.546 3.229
Costo total $1.054 $0.582
Precio de entrada $2.000 / 1M $1.500 / 1M
Precio de salida $12.000 / 1M $9.000 / 1M
Total de tokens de entrada 41,617 36,936
Tokens de salida 1,977 2,001
Tokens de razonamiento 78,896 56,408
Tiempo de respuesta (promedio) 20.14s 4.94s
Tiempo de respuesta (máximo) 88.68s 18.07s
Tiempo de respuesta (total) 281.92s 103.79s

Generación showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#7 Gemini 3.1 Pro Preview

medium
Coste
$0.115
Tiempo
87.2s
Tokens
9,629 tok

#8 Gemini 3.5 Flash

medium
Coste
$0.201
Tiempo
112.9s
Tokens
22,371 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 498 112 3,218
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.09s 492 171 3,385
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemini 3.1 Pro Preview 7.9 9.9 66.7% 0 40.17s 8,124 435 41,247
Gemini 3.5 Flash 7.9 7.5 77.8% 1 12.63s 8,118 461 24,939
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 17,240 432 9,281
Gemini 3.5 Flash 10.0 10.0 100.0% 0 12.05s 12,873 351 7,807
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 7,265 279 3,904
Gemini 3.5 Flash 10.0 10.0 100.0% 0 4.07s 7,548 279 3,784
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 635 18 12,424
Gemini 3.5 Flash 7.7 10.0 66.7% 0 5.24s 633 12 8,047
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 490 108 1,179
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.52s 486 115 1,144
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 621 72 2,236
Gemini 3.5 Flash 9.9 10.0 100.0% 0 2.70s 615 71 2,855
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 6.90s 570 235 3,128
Gemini 3.5 Flash 7.7 10.0 66.7% 0 2.38s 558 295 2,747
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 6,018 274 982
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.81s 5,457 234 455
Cultura general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 6.27s 156 12 1,297
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.75s 156 12 1,245

Comparación rápida

Cambiar par de comparación