Navegación
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs Qwen: Qwen3.5-122B-A10B

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-02

Métrica GPT-5.2 Chat GPT-5.2 Chat none Lanzamiento: 2025-12-11 Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium Lanzamiento: 2026-02-24
Puntuación 7.9 7.7
Rango #32 #41
Fiabilidad 10.0 10.0
Consistencia 8.9 8.8
Pruebas correctas
Tasa de aciertos por intento 73.3% 71.7%
Pruebas inestables 3 3
Ejecuciones totales 60 60
Costo por resultado 2.703 5.031
Costo total $0.352 $0.509
Precio de entrada $1.750 / 1M $0.260 / 1M
Precio de salida $14.000 / 1M $2.080 / 1M
Total de tokens de entrada 31,593 38,997
Tokens de salida 21,144 26,166
Tokens de razonamiento 0 213,524
Tiempo de respuesta (promedio) 6.82s 39.40s
Tiempo de respuesta (máximo) 38.52s 168.16s
Tiempo de respuesta (total) 136.34s 788.00s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 606 1,807 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.75s 672 269 16,835
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
GPT-5.2 Chat 8.2 6.7 83.3% 1 8.05s 4,686 4,131 0
Qwen3.5-122B-A10B 4.1 5.8 33.3% 1 119.57s 4,795 8,036 45,074
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 11,019 1,243 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 107.79s 14,947 483 11,337
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 7,140 980 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 23.41s 7,782 270 16,558
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 723 7,810 0
Qwen3.5-122B-A10B 2.9 7.2 11.1% 1 63.40s 771 15,537 64,889
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 477 335 0
Qwen3.5-122B-A10B 3.4 2.2 33.3% 1 34.11s 344 66 7,592
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
GPT-5.2 Chat 9.8 10.0 100.0% 0 5.51s 660 1,441 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 9.88s 593 77 7,372
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.10s 642 1,603 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 17.89s 696 284 27,575
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 5,445 555 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 4.60s 8,193 322 1,226
Cultura general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
GPT-5.2 Chat 3.0 10.0 0.0% 0 6.89s 195 1,239 0
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 52.87s 204 822 15,066

Comparación rápida

Cambiar par de comparación