Claude Opus 4.8 (medium) vs Gemini 3.5 Flash

Modelo recomendado Claude Opus 4.8 (medium)

Tiene la puntuación más alta en esta comparación (8.8) y el mejor equilibrio general entre coste y tiempo de respuesta en los 2 modelos.

Comparación detallada

Métrica	Claude Opus 4.8 Claude Opus 4.8 medium Lanzamiento: 2026-05-28	Gemini 3.5 Flash Gemini 3.5 Flash none Lanzamiento: 2026-05-19

Métrica	Claude Opus 4.8 Claude Opus 4.8 medium Lanzamiento: 2026-05-28	Gemini 3.5 Flash Gemini 3.5 Flash none Lanzamiento: 2026-05-19
Puntuación	8.8	7.0
Rango	#19	#87
Fiabilidad	10.0	10.0
Consistencia	9.6	8.9
Pruebas correctas
Tasa de aciertos por intento	84.9%	74.2%
Pruebas inestables	1	3
Ejecuciones totales	66	66
Costo por resultado	10.724	7.190
Costo total	$1.931	$1.079
Precio de entrada	$5.000 / 1M	$1.500 / 1M
Precio de salida	$25.000 / 1M	$9.000 / 1M
Total de tokens de entrada	138,451	13,843
Tokens de salida	40,766	117,518
Tokens de razonamiento	9,075	0
Tiempo de respuesta (promedio)	12.49s	9.93s
Tiempo de respuesta (máximo)	70.54s	64.36s
Tiempo de respuesta (total)	274.72s	178.68s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

none

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.8	10.0	10.0	100.0%	0		3.95s	834	1,179	478
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.53s	492	5,101	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.8	10.0	10.0	100.0%	0		15.33s	10,590	9,945	1,381
Gemini 3.5 Flash	8.8	7.8	88.9%	1		34.69s	8,122	75,927	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.8	9.9	10.0	100.0%	0		54.29s	101,005	19,531	4,762
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.8	7.1	5.6	83.3%	1		12.29s	10,503	481	312
Gemini 3.5 Flash	6.5	10.0	50.0%	0		8.10s	2,781	5,895	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.8	5.3	10.0	33.3%	0		14.59s	975	7,477	900
Gemini 3.5 Flash	7.6	7.2	77.8%	1		10.64s	633	17,910	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.8	10.0	10.0	100.0%	0		2.46s	708	237	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.46s	486	1,620	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.8	10.0	10.0	100.0%	0		3.32s	909	373	320
Gemini 3.5 Flash	9.8	10.0	100.0%	0		3.38s	615	3,928	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.8	10.0	10.0	100.0%	0		3.95s	894	791	483
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.13s	558	4,640	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.8	10.0	10.0	100.0%	0		8.96s	11,775	301	225
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Opus 4.8	3.0	10.0	0.0%	0		6.14s	258	451	214
Gemini 3.5 Flash	2.8	1.6	33.3%	1		4.87s	156	2,497	0

Cambiar par de comparación