AI BENCHY
Comparar
❤️ Made by XCS

Nombre del modelo

Google: Gemini 3 Flash Preview

Benchmarks generados a partir de los suites de prueba de Aibenchy en : 19 feb 2026

Métrica Google: Gemini 3 Flash Preview
Rango#1
EmpresaGoogle
Score 9.92
Consistencia 10.00
Costo por resultado 0.8502
Costo total $0.10203
Pruebas correctas 12/12
Tasa de aciertos por intento 100.0%
Pruebas inestables 0
Tokens de salida 590
Tokens de razonamiento 31,913

Desglose por categoría

Categoría Pruebas totalmente superadas Score Consistencia Tasa de aciertos por intento Pruebas inestables Puntuación de razonamiento Costo
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 7.17 $0.00544
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.17 $0.02077
Domain specific 3/3 10.00 10.00 100.0% 0 5.56 $0.04625
Instructions following 2/2 10.00 10.00 100.0% 0 5.50 $0.01281
Puzzle Solving 3/3 9.67 10.00 100.0% 0 6.50 $0.01679

Modelos comparados

Comparar Google: Gemini 3 Flash Preview contra...

#2 · Google

Google: Gemini 3.1 Pro Preview

Razonamiento (medium)

Score: 9.25

Consistencia: 10.00

Tasa de aciertos por intento: 91.7%

Pruebas inestables: 0

Costo por resultado: 2.5543

Pruebas correctas: 11/12

Costo total: $0.28097

Comparar

#3 · Google

Google: Gemini 3 Pro Preview

Razonamiento (medium)

Score: 8.42

Consistencia: 10.00

Tasa de aciertos por intento: 83.3%

Pruebas inestables: 0

Costo por resultado: 0.8028

Pruebas correctas: 10/12

Costo total: $0.08029

Comparar

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

Razonamiento (medium)

Score: 8.42

Consistencia: 9.30

Tasa de aciertos por intento: 86.1%

Pruebas inestables: 1

Costo por resultado: 2.3151

Pruebas correctas: 10/12

Costo total: $0.23151

Comparar

Comparación rápida

Comparar Google: Gemini 3 Flash Preview contra...