AI BENCHY
Comparar
❤️ Made by XCS

Nombre del modelo

OpenAI: GPT-4o-mini

Benchmarks generados a partir de los suites de prueba de Aibenchy en : 19 feb 2026

Métrica OpenAI: GPT-4o-mini
Rango#19
EmpresaOpenAI
Score 4.00
Consistencia 9.98
Costo por resultado 0.0576
Costo total $0.00173
Pruebas correctas 3/12
Tasa de aciertos por intento 25.0%
Pruebas inestables 0
Tokens de salida 570
Tokens de razonamiento 0

Desglose por categoría

Categoría Pruebas totalmente superadas Score Consistencia Tasa de aciertos por intento Pruebas inestables Puntuación de razonamiento Costo
Anti-AI Tricks 0/2 1.00 10.00 0.0% 0 - $0.00005
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 - $0.00115
Domain specific 0/3 1.00 10.00 0.0% 0 - $0.00012
Instructions following 1/2 5.50 10.00 50.0% 0 - $0.00015
Puzzle Solving 0/3 4.00 9.92 0.0% 0 - $0.00028

Modelos comparados

Comparar OpenAI: GPT-4o-mini contra...

#18 · Stepfun

StepFun: Step 3.5 Flash

Razonamiento (medium)

Score: 4.92

Consistencia: 7.34

Tasa de aciertos por intento: 58.3%

Pruebas inestables: 4

Costo por resultado: 0.0000

Pruebas correctas: 5/12

Costo total: $0.00000

Comparar

#20 · Z.ai

Z.ai: GLM 4.7 Flash

Razonamiento (medium)

Score: 3.92

Consistencia: 6.51

Tasa de aciertos por intento: 50.0%

Pruebas inestables: 5

Costo por resultado: 0.2253

Pruebas correctas: 4/12

Costo total: $0.00902

Comparar

#17 · MiniMax

MiniMax: MiniMax M2.5

Razonamiento (medium)

Score: 5.08

Consistencia: 6.00

Tasa de aciertos por intento: 61.1%

Pruebas inestables: 6

Costo por resultado: 4.0276

Pruebas correctas: 5/12

Costo total: $0.20138

Comparar

Comparación rápida

Comparar OpenAI: GPT-4o-mini contra...