AI BENCHY
Comparar Gráficos
❤️ Made by XCS
Your ad here

#33

GPT-5 Mini

OpenAI · Lanzamiento: 2025-08-07 · openai/gpt-5-mini::medium

Puntaje prom.

5.77

Costo por resultado

1.200

Consistencia

8.80

Costo total

$0.084

Pruebas correctas

7

Una prueba cuenta como totalmente superada solo si todas sus ejecuciones pasan.

Pruebas incorrectas

7

Tasa de aciertos por intento: 57.1%

Pruebas inestables

2

Tiempo de respuesta: promedio 21.47s · total 300.64s · máximo 82.55s

No siguió las instrucciones: 3 Respuesta incorrecta: 3 Tiempo agotado: 1

Mejores modelos por puntuación

Elige el primer modelo y luego haz clic en un segundo modelo para abrir una página lado a lado.

Comparación rápida

Desglose por categoría

Categoría Puntaje prom. Consistencia Pruebas correctas
Anti-AI Tricks 7.00 9.62 2/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 1.00 7.21 0/3
Instructions following 7.00 6.64 1/2
Puzzle Solving 4.34 9.78 1/3
Tool Calling 10.00 10.00 1/1