AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.3 Chat

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-22

Métrica	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Lanzamiento: 2026-03-03	GPT-5.3 Chat GPT-5.3 Chat none Lanzamiento: 2026-03-03

Métrica	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Lanzamiento: 2026-03-03	GPT-5.3 Chat GPT-5.3 Chat none Lanzamiento: 2026-03-03
Puntuación	7.6	7.4
Rango	#41	#52
Fiabilidad	10.0	10.0
Consistencia	10.0	8.4
Pruebas correctas
Tasa de aciertos por intento	65.0%	68.3%
Pruebas inestables	0	4
Ejecuciones totales	60	60
Costo por resultado	0.186	3.342
Costo total	$0.025	$0.401
Precio de entrada	$0.250 / 1M	$1.750 / 1M
Precio de salida	$1.500 / 1M	$14.000 / 1M
Tokens de salida	2,280	24,689
Tokens de razonamiento	8,829	0
Tiempo de respuesta (promedio)	3.01s	6.10s
Tiempo de respuesta (máximo)	11.91s	18.33s
Tiempo de respuesta (total)	60.27s	121.99s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	8.3	10.0	75.0%	0		2.12s	462	1,638
GPT-5.3 Chat	6.7	8.1	58.3%	1		3.86s	3,167	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	6.8	10.0	50.0%	0		1.56s	654	723
GPT-5.3 Chat	6.9	6.2	66.7%	1		10.52s	4,772	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		11.91s	225	762
GPT-5.3 Chat	10.0	10.0	100.0%	0		11.96s	2,614	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.00s	291	696
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.21s	942	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		2.36s	18	1,212
GPT-5.3 Chat	3.5	4.4	33.3%	2		13.01s	8,264	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		1.54s	69	384
GPT-5.3 Chat	4.6	10.0	0.0%	0		1.99s	319	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.49s	72	753
GPT-5.3 Chat	9.8	10.0	100.0%	0		3.29s	1,455	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		2.76s	243	1,248
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.93s	1,726	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		9.54s	237	993
GPT-5.3 Chat	10.0	10.0	100.0%	0		8.36s	861	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		1.35s	9	420
GPT-5.3 Chat	3.0	10.0	0.0%	0		4.38s	569	0

Comparación rápida

Cambiar par de comparación

GPT-5.3 ChatnonevsMiMo-V2.5medium Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2.5-Promedium Gemini 3.1 Flash Lite PreviewlowvsQwen3.5 Plus 2026-04-20medium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2 Chatnone GPT-5.3 ChatnonevsGLM 5.1medium Kimi K2.6mediumvsGPT-5.3 Chatnone DeepSeek V4 FlashhighDisponible gratisvsGPT-5.3 Chatnone Gemini 3.1 Flash LitelowvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsQwen3.5-Flashmedium Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2-Promedium GPT-5.3 ChatnonevsStep 3.5 Flashmedium Gemini 3.1 Flash Lite PreviewlowvsGrok Build 0.1medium