Claude Opus 4.8 (medium) vs Gemini 3.5 Flash (medium)

Modelo recomendado Gemini 3.5 Flash (medium)

Tiene la mejor puntuación aquí (9.1) y cuesta aproximadamente 3.0x menos que Claude Opus 4.8 (medium).

Comparación detallada

Métrica	Claude Opus 4.8 Claude Opus 4.8 medium Lanzamiento: 2026-05-28	Gemini 3.5 Flash Gemini 3.5 Flash medium Lanzamiento: 2026-05-19

Métrica	Claude Opus 4.8 Claude Opus 4.8 medium Lanzamiento: 2026-05-28	Gemini 3.5 Flash Gemini 3.5 Flash medium Lanzamiento: 2026-05-19
Puntuación	8.8	9.1
Rango	#19	#14
Fiabilidad	10.0	10.0
Consistencia	9.6	9.7
Pruebas correctas
Tasa de aciertos por intento	84.9%	87.9%
Pruebas inestables	1	1
Ejecuciones totales	66	66
Costo por resultado	10.724	3.374
Costo total	$1.931	$0.642
Precio de entrada	$5.000 / 1M	$1.500 / 1M
Precio de salida	$25.000 / 1M	$9.000 / 1M
Total de tokens de entrada	138,451	69,747
Tokens de salida	40,766	2,166
Tokens de razonamiento	9,075	57,436
Tiempo de respuesta (promedio)	12.49s	8.20s
Tiempo de respuesta (máximo)	70.54s	76.68s
Tiempo de respuesta (total)	274.72s	180.47s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

medium

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.8	10.0	10.0	100.0%	0		3.95s	834	1,179	478
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.09s	492	171	3,385

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.8	10.0	10.0	100.0%	0		15.33s	10,590	9,945	1,381
Gemini 3.5 Flash	7.9	7.5	77.8%	1		12.63s	8,118	461	24,939

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.8	9.9	10.0	100.0%	0		54.29s	101,005	19,531	4,762
Gemini 3.5 Flash	10.0	10.0	100.0%	0		44.36s	45,684	516	8,835

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.8	7.1	5.6	83.3%	1		12.29s	10,503	481	312
Gemini 3.5 Flash	10.0	10.0	100.0%	0		4.07s	7,548	279	3,784

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.8	5.3	10.0	33.3%	0		14.59s	975	7,477	900
Gemini 3.5 Flash	7.7	10.0	66.7%	0		5.24s	633	12	8,047

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.8	10.0	10.0	100.0%	0		2.46s	708	237	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.52s	486	115	1,144

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.8	10.0	10.0	100.0%	0		3.32s	909	373	320
Gemini 3.5 Flash	9.9	10.0	100.0%	0		2.70s	615	71	2,855

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.8	10.0	10.0	100.0%	0		3.95s	894	791	483
Gemini 3.5 Flash	7.7	10.0	66.7%	0		2.38s	558	295	2,747

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.8	10.0	10.0	100.0%	0		8.96s	11,775	301	225
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.81s	5,457	234	455

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.8	3.0	10.0	0.0%	0		6.14s	258	451	214
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.75s	156	12	1,245

Cambiar par de comparación