AI BENCHY
Comparar
❤️ Made by XCS
Your ad here

Nombre del modelo

OpenAI: GPT-5.3-Codex

Razonamiento (medium)

Benchmarks generados a partir de los suites de prueba de AI BENCHY en : 24 feb 2026

Métrica OpenAI: GPT-5.3-Codex
Rango#6
EmpresaOpenAI
Score 7.77
Consistencia 8.75
Costo por resultado 4.9342
Costo total $0.44408
Pruebas correctas
Tasa de aciertos por intento 76.9%
Pruebas inestables 2
Tokens de salida 947
Tokens de razonamiento 29,564
Tiempo de respuesta (promedio)17944ms
Tiempo de respuesta (total)233267ms
Tiempo de respuesta (máximo)100927ms

Desglose por categoría

Categoría Pruebas totalmente superadas Score Consistencia Tasa de aciertos por intento Pruebas inestables Puntuación de razonamiento Tiempo de respuesta (promedio) Costo
Trucos anti-IA 10.00 10.00 100.0% 0 6.00 4687ms $0.02371
Análisis y extracción de datos 10.00 10.00 100.0% 0 1.25 3180ms $0.02600
Específico del dominio 4.00 7.21 55.6% 1 1.00 64314ms $0.35664
Seguimiento de instrucciones 9.00 10.00 50.0% 0 1.00 3037ms $0.01216
Puzzle Solving 7.00 7.38 77.8% 1 6.00 4610ms $0.02559

Modelos comparados

Comparar OpenAI: GPT-5.3-Codex contra...

#5 · Google

Google: Gemini 3 Flash Preview

Razonamiento (low)

Score: 8.23

Consistencia: 8.71

Tasa de aciertos por intento: 82.0%

Pruebas inestables: 2

Costo por resultado: 0.6173

Pruebas correctas:

Costo total: $0.06174

Comparar

#7 · OpenAI

OpenAI: GPT-5.2

Razonamiento (medium)

Score: 7.38

Consistencia: 8.73

Tasa de aciertos por intento: 76.9%

Pruebas inestables: 2

Costo por resultado: 2.5637

Pruebas correctas:

Costo total: $0.23074

Comparar

#4 · Qwen

Qwen: Qwen3.5 Plus 2026-02-15

Razonamiento (medium)

Score: 8.54

Consistencia: 9.35

Tasa de aciertos por intento: 87.2%

Pruebas inestables: 1

Costo por resultado: 2.1621

Pruebas correctas:

Costo total: $0.23784

Comparar

Comparación rápida

Comparar OpenAI: GPT-5.3-Codex contra...