Navegación
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs Z.ai: GLM 5.2

Resumen

Comparación benchmark de GPT-5.2 Chat vs GLM 5.2: GLM 5.2 lidera en puntuación media con 8.7 vs 8.5. GLM 5.2 tiene menor coste de benchmark con $0.324 vs $0.393. GPT-5.2 Chat es más rápido con 7.13s vs 23.28s, con tasas de acierto de 74.6% vs 84.1%.

Modelo recomendado: GPT-5.2 Chat - Su puntuación se mantiene cerca de la mejor aquí (8.5 vs 8.7) y responde aproximadamente 3.3x más rápido que GLM 5.2.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-17

Métrica GPT-5.2 Chat GPT-5.2 Chat none Lanzamiento: 2025-12-11 GLM 5.2 GLM 5.2 medium Lanzamiento: 2026-06-17
Puntuación 8.5 8.7
Rango #19 #14
Fiabilidad 10.0 9.5
Consistencia 8.9 8.4
Pruebas correctas
Tasa de aciertos por intento 74.6% 84.1%
Pruebas inestables 3 4
Ejecuciones totales 63 63
Costo por resultado 2.803 2.159
Costo total $0.393 $0.324
Precio de entrada $1.750 / 1M $1.400 / 1M
Precio de salida $14.000 / 1M $4.400 / 1M
Total de tokens de entrada 34,212 37,199
Tokens de salida 23,744 12,261
Tokens de razonamiento 0 49,500
Tiempo de respuesta (promedio) 7.13s 23.28s
Tiempo de respuesta (máximo) 38.52s 101.36s
Tiempo de respuesta (total) 149.69s 488.94s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#19 GPT-5.2 Chat

none
Cost
$0.010
Time
15.3s
Tokens
797 tok

#14 GLM 5.2

medium
Cost
$0.041
Time
195.8s
Tokens
9,287 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 606 1,807 0
GLM 5.2 10.0 10.0 100.0% 0 5.89s 639 497 2,634
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
GPT-5.2 Chat 8.8 7.8 88.9% 1 9.82s 7,305 6,731 0
GLM 5.2 8.2 7.2 88.9% 1 40.96s 7,317 1,475 17,123
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 11,019 1,243 0
GLM 5.2 10.0 10.0 100.0% 0 51.96s 12,696 458 4,531
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 7,140 980 0
GLM 5.2 10.0 10.0 100.0% 0 13.44s 7,149 348 2,345
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 723 7,810 0
GLM 5.2 4.1 4.4 44.5% 2 45.47s 551 8,188 11,606
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 477 335 0
GLM 5.2 10.0 10.0 100.0% 0 17.39s 498 54 1,842
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
GPT-5.2 Chat 9.8 10.0 100.0% 0 5.51s 660 1,441 0
GLM 5.2 9.9 10.0 100.0% 0 7.90s 678 94 1,518
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.10s 642 1,603 0
GLM 5.2 8.2 7.2 88.9% 1 13.13s 672 536 4,822
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 5,445 555 0
GLM 5.2 10.0 10.0 100.0% 0 20.41s 6,861 230 550
Cultura general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
GPT-5.2 Chat 3.0 10.0 0.0% 0 6.89s 195 1,239 0
GLM 5.2 3.0 10.0 0.0% 0 34.25s 138 381 2,529

Comparación rápida

Cambiar par de comparación