OpenAI: GPT-5.3 Chat vs Xiaomi: MiMo-V2.5-Pro

GPT-5.3 Chat lidera en puntuación media con 7.5 vs 6.9. MiMo-V2.5-Pro (medium) tiene menor coste de benchmark con $0.187 vs $0.571. GPT-5.3 Chat es más rápido con 6.88s vs 33.92s, con tasas de acierto de 68.2% vs 66.7%.

Modelo recomendadoGPT-5.3 ChatTiene la mejor puntuación aquí (7.5) y responde aproximadamente 4.9x más rápido que MiMo-V2.5-Pro (medium).

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-07-25

Métrica	GPT-5.3 Chat GPT-5.3 Chat none Lanzamiento: 2026-03-03	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Lanzamiento: 2026-04-22

Métrica	GPT-5.3 Chat GPT-5.3 Chat none Lanzamiento: 2026-03-03	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Lanzamiento: 2026-04-22
Puntuación	7.5	6.9
Rango	#62	#92
Fiabilidad	10.0	10.0
Consistencia	8.2	8.2
Pruebas correctas
Tasa de aciertos por intento	68.2%	66.7%
Pruebas inestables	5	5
Ejecuciones totales	66	66
Costo por resultado	4.387	3.218
Costo total	$0.571	$0.187
Precio de entrada	$1.750 / 1M	$0.435 / 1M
Precio de salida	$14.000 / 1M	$0.870 / 1M
Total de tokens de entrada	78,990	139,883
Tokens de salida	30,854	15,521
Tokens de razonamiento	0	130,992
Tiempo de respuesta (promedio)	6.88s	33.92s
Tiempo de respuesta (máximo)	18.33s	197.54s
Tiempo de respuesta (total)	151.31s	746.19s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#62 GPT-5.3 Chat

none

Coste: $0.008
Tiempo: 8.1s
Tokens: 634 tok

#92 MiMo-V2.5-Pro

medium

SVG inválido

Coste: $0.000
Tiempo: 300.0s
Tokens: 0 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.3 Chat	6.7	8.1	58.3%	1		3.86s	606	3,167	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.26s	621	323	1,179

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.3 Chat	5.6	4.7	55.6%	2		10.52s	7,302	6,632	0
MiMo-V2.5-Pro	6.2	4.7	66.7%	2		92.07s	6,543	780	51,218

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.3 Chat	10.0	10.0	100.0%	0		15.07s	55,800	6,851	0
MiMo-V2.5-Pro	6.9	5.9	66.7%	1		125.45s	114,089	10,854	45,120

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.21s	7,140	942	0
MiMo-V2.5-Pro	7.3	5.8	83.3%	1		18.81s	7,746	260	8,383

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.3 Chat	3.5	4.4	33.3%	2		13.01s	723	8,264	0
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		37.87s	630	275	17,023

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.3 Chat	4.6	10.0	0.0%	0		1.99s	477	319	0
MiMo-V2.5-Pro	5.5	10.0	0.0%	0		4.02s	492	155	163

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.3 Chat	9.8	10.0	100.0%	0		3.51s	660	1,491	0
MiMo-V2.5-Pro	9.9	10.0	100.0%	0		2.77s	672	82	803

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.99s	642	1,758	0
MiMo-V2.5-Pro	6.7	7.9	55.6%	1		5.31s	660	540	2,181

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.3 Chat	10.0	10.0	100.0%	0		8.36s	5,445	861	0
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		16.87s	8,220	311	2,908

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
GPT-5.3 Chat	3.0	10.0	0.0%	0		4.38s	195	569	0
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		12.46s	210	1,941	2,014

Comparación rápida

Cambiar par de comparación

GPT-5.6 SolnonevsMiMo-V2.5-Promedium DeepSeek V4 PrononevsMiMo-V2.5-Promedium Kimi K2.7 CodemediumvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsQwen3.5 Plus 2026-02-15medium Step 3.7 FlashhighvsMiMo-V2.5-Promedium GPT-5.5nonevsMiMo-V2.5-Promedium Nemotron 3 UltramediumDisponible gratisvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsQwen3.5-27Bmedium Gemini 3.5 FlashminimalvsMiMo-V2.5-Promedium GPT-5.3 ChatnonevsGrok Build 0.1medium Gemini 3.5 FlashnonevsMiMo-V2.5-Promedium LongCat 2.0mediumvsGPT-5.3 Chatnone