Google: Gemini 3.1 Pro Preview vs OpenAI: GPT-5.5

Gemini 3.1 Pro Preview (medium) lidera en puntuación media con 9.2 vs 9.0. Gemini 3.1 Pro Preview (medium) tiene menor coste de benchmark con $1.361 vs $4.137. Gemini 3.1 Pro Preview (medium) es más rápido con 21.47s vs 38.42s, con tasas de acierto de 90.9% vs 87.9%.

Modelo recomendadoGemini 3.1 Pro Preview (medium)Tiene la mejor puntuación aquí (9.2) y cuesta aproximadamente 3.0x menos que GPT-5.5 (medium).

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-07-24

Métrica	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Lanzamiento: 2026-02-19	GPT-5.5 GPT-5.5 medium Lanzamiento: 2026-04-24

Métrica	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Lanzamiento: 2026-02-19	GPT-5.5 GPT-5.5 medium Lanzamiento: 2026-04-24
Puntuación	9.2	9.0
Rango	#10	#13
Fiabilidad	10.0	10.0
Consistencia	10.0	8.9
Pruebas correctas
Tasa de aciertos por intento	90.9%	87.9%
Pruebas inestables	0	3
Ejecuciones totales	66	66
Costo por resultado	6.801	22.980
Costo total	$1.361	$4.137
Precio de entrada	$2.000 / 1M	$5.000 / 1M
Precio de salida	$12.000 / 1M	$30.000 / 1M
Total de tokens de entrada	92,287	80,659
Tokens de salida	5,232	5,617
Tokens de razonamiento	92,726	118,819
Tiempo de respuesta (promedio)	21.47s	38.42s
Tiempo de respuesta (máximo)	88.68s	332.10s
Tiempo de respuesta (total)	322.08s	845.35s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#10 Gemini 3.1 Pro Preview

medium

Coste: $0.115
Tiempo: 87.2s
Tokens: 9,629 tok

#13 GPT-5.5

medium

Coste: $0.112
Tiempo: 71.9s
Tokens: 3,807 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	498	112	3,218
GPT-5.5	10.0	10.0	100.0%	0		4.66s	606	250	1,335

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Pro Preview	7.9	9.9	66.7%	0		40.17s	8,124	435	41,247
GPT-5.5	8.8	7.8	88.9%	1		59.77s	7,305	362	24,959

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Pro Preview	9.8	10.0	100.0%	0		40.39s	67,910	3,687	23,111
GPT-5.5	10.0	10.0	100.0%	0		33.52s	57,466	3,944	6,735

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	7,265	279	3,904
GPT-5.5	10.0	10.0	100.0%	0		4.18s	7,140	234	593

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	635	18	12,424
GPT-5.5	5.3	7.2	44.4%	1		164.14s	723	67	79,625

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	490	108	1,179
GPT-5.5	10.0	10.0	100.0%	0		4.16s	477	138	223

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	621	72	2,236
GPT-5.5	10.0	10.0	100.0%	0		3.36s	660	93	538

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.90s	570	235	3,128
GPT-5.5	10.0	10.0	100.0%	0		6.76s	642	241	2,225

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	6,018	274	982
GPT-5.5	10.0	10.0	100.0%	0		10.57s	5,445	258	832

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.27s	156	12	1,297
GPT-5.5	2.8	1.6	33.3%	1		37.86s	195	30	1,754

Comparación rápida

Cambiar par de comparación

Gemini 3.5 FlashlowvsGPT-5.5medium GPT-5.5mediumvsGrok 4.5high Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Gemini 3.1 Pro PreviewmediumvsGPT-5.6 Solhigh Gemini 3.1 Pro PreviewmediumvsGPT-5.6 Sollow Gemini 3.1 Pro PreviewmediumvsGrok 4.5high Gemini 3.6 FlashlowvsGPT-5.5medium Gemini 3.5 FlashhighvsGPT-5.5medium GPT-5.5mediumvsGrok 4.5low Gemini 3.6 FlashhighvsGPT-5.5medium Muse Spark 1.1lowvsGPT-5.5medium Gemini 3.1 Pro PreviewmediumvsGrok 4.5low