Google: Gemini 3.1 Flash Lite Preview vs OpenAI: GPT-5.3 Chat

GPT-5.3 Chat lidera en puntuación media con 7.5 vs 6.4. Gemini 3.1 Flash Lite Preview tiene menor coste de benchmark con $0.052 vs $0.571. Gemini 3.1 Flash Lite Preview es más rápido con 1.58s vs 6.88s, con tasas de acierto de 57.6% vs 68.2%.

Modelo recomendadoGemini 3.1 Flash Lite PreviewOfrece el mejor equilibrio general: puntuación competitiva (6.4), menor coste que GPT-5.3 Chat y tiempo de respuesta equilibrado.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-07-21

Métrica	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Lanzamiento: 2026-03-03	GPT-5.3 Chat GPT-5.3 Chat none Lanzamiento: 2026-03-03

Métrica	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Lanzamiento: 2026-03-03	GPT-5.3 Chat GPT-5.3 Chat none Lanzamiento: 2026-03-03
Puntuación	6.4	7.5
Rango	#112	#58
Fiabilidad	10.0	10.0
Consistencia	9.7	8.2
Pruebas correctas
Tasa de aciertos por intento	57.6%	68.2%
Pruebas inestables	1	5
Ejecuciones totales	66	66
Costo por resultado	0.431	4.387
Costo total	$0.052	$0.571
Precio de entrada	$0.250 / 1M	$1.750 / 1M
Precio de salida	$1.500 / 1M	$14.000 / 1M
Total de tokens de entrada	120,942	78,990
Tokens de salida	14,292	30,854
Tokens de razonamiento	0	0
Tiempo de respuesta (promedio)	1.58s	6.88s
Tiempo de respuesta (máximo)	9.27s	18.33s
Tiempo de respuesta (total)	34.72s	151.31s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#112 Gemini 3.1 Flash Lite Preview

none

Coste: $0.003
Tiempo: 4.7s
Tokens: 1,827 tok

#58 GPT-5.3 Chat

none

Coste: $0.008
Tiempo: 8.1s
Tokens: 634 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	7.5	8.4	66.7%	1		1.04s	504	1,092	0
GPT-5.3 Chat	6.7	8.1	58.3%	1		3.86s	606	3,167	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		967ms	8,128	670	0
GPT-5.3 Chat	5.6	4.7	55.6%	2		10.52s	7,302	6,632	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		6.23s	96,386	9,084	0
GPT-5.3 Chat	10.0	10.0	100.0%	0		15.07s	55,800	6,851	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.22s	7,550	399	0
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.21s	7,140	942	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		942ms	641	568	0
GPT-5.3 Chat	3.5	4.4	33.3%	2		13.01s	723	8,264	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		741ms	488	69	0
GPT-5.3 Chat	4.6	10.0	0.0%	0		1.99s	477	319	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.13s	623	574	0
GPT-5.3 Chat	9.8	10.0	100.0%	0		3.51s	660	1,491	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		900ms	570	1,045	0
GPT-5.3 Chat	10.0	10.0	100.0%	0		2.99s	642	1,758	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.39s	5,894	782	0
GPT-5.3 Chat	10.0	10.0	100.0%	0		8.36s	5,445	861	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		814ms	158	9	0
GPT-5.3 Chat	3.0	10.0	0.0%	0		4.38s	195	569	0

Comparación rápida

Cambiar par de comparación

Kimi K2.7 CodemediumvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsQwen3.5 Plus 2026-02-15medium Nemotron 3 UltramediumDisponible gratisvsGPT-5.3 Chatnone Gemini 3.1 Flash Lite PreviewnonevsLaguna XS 2.1mediumDisponible gratis Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2.5medium GPT-5.3 ChatnonevsQwen3.5-27Bmedium GPT-5.3 ChatnonevsGrok Build 0.1medium Gemini 3.1 Flash Lite PreviewnonevsQwen3.6 27Bmedium LongCat 2.0mediumvsGPT-5.3 Chatnone Gemini 3.1 Flash Lite PreviewnonevsRing-2.6-1Tmedium MiniMax M3mediumvsGPT-5.3 Chatnone Gemini 3 Flash PreviewlowvsGPT-5.3 Chatnone