AI BENCHY
Comparar
❤️ Made by XCS

Nombre del modelo

Google: Gemini 3.1 Pro Preview

Benchmarks generados a partir de los suites de prueba de Aibenchy en : 19 feb 2026

Métrica Google: Gemini 3.1 Pro Preview
Rango#2
EmpresaGoogle
Score 9.25
Consistencia 10.00
Costo por resultado 2.5543
Costo total $0.28097
Pruebas correctas 11/12
Tasa de aciertos por intento 91.7%
Pruebas inestables 0
Tokens de salida 632
Tokens de razonamiento 21,277

Desglose por categoría

Categoría Pruebas totalmente superadas Score Consistencia Tasa de aciertos por intento Pruebas inestables Puntuación de razonamiento Costo
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 5.75 $0.02289
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.50 $0.05541
Domain specific 2/3 7.00 10.00 66.7% 0 5.63 $0.12975
Instructions following 2/2 10.00 10.00 100.0% 0 5.67 $0.03134
Puzzle Solving 3/3 10.00 10.00 100.0% 0 8.89 $0.04159

Modelos comparados

Comparar Google: Gemini 3.1 Pro Preview contra...

#1 · Google

Google: Gemini 3 Flash Preview

Razonamiento (medium)

Score: 9.92

Consistencia: 10.00

Tasa de aciertos por intento: 100.0%

Pruebas inestables: 0

Costo por resultado: 0.8502

Pruebas correctas: 12/12

Costo total: $0.10203

Comparar

#3 · Google

Google: Gemini 3 Pro Preview

Razonamiento (medium)

Score: 8.42

Consistencia: 10.00

Tasa de aciertos por intento: 83.3%

Pruebas inestables: 0

Costo por resultado: 0.8028

Pruebas correctas: 10/12

Costo total: $0.08029

Comparar

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

Razonamiento (medium)

Score: 8.42

Consistencia: 9.30

Tasa de aciertos por intento: 86.1%

Pruebas inestables: 1

Costo por resultado: 2.3151

Pruebas correctas: 10/12

Costo total: $0.23151

Comparar

Comparación rápida

Comparar Google: Gemini 3.1 Pro Preview contra...