AI BENCHY Compare

Anthropic: Claude Sonnet 5 vs Google: Gemini 3.1 Flash Lite Preview

Resumen

Comparación benchmark de Claude Sonnet 5 vs Gemini 3.1 Flash Lite Preview: Gemini 3.1 Flash Lite Preview lidera en puntuación media con 6.5 vs 5.7. Gemini 3.1 Flash Lite Preview tiene menor coste de benchmark con $0.026 vs $0.287. Gemini 3.1 Flash Lite Preview es más rápido con 2.77s vs 4.74s, con tasas de acierto de 42.9% vs 61.9%.

Modelo recomendado: Gemini 3.1 Flash Lite Preview - Tiene la mejor puntuación aquí (6.5) y cuesta aproximadamente 11.3x menos que Claude Sonnet 5.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-30

Métrica	Claude Sonnet 5 Claude Sonnet 5 none Lanzamiento: 2026-06-30	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Lanzamiento: 2026-03-03

Métrica	Claude Sonnet 5 Claude Sonnet 5 none Lanzamiento: 2026-06-30	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Lanzamiento: 2026-03-03
Puntuación	5.7	6.5
Rango	#117	#84
Fiabilidad	10.0	10.0
Consistencia	8.6	10.0
Pruebas correctas
Tasa de aciertos por intento	42.9%	61.9%
Pruebas inestables	4	0
Ejecuciones totales	63	63
Costo por resultado	4.098	0.196
Costo total	$0.287	$0.026
Precio de entrada	$2.000 / 1M	$0.250 / 1M
Precio de salida	$10.000 / 1M	$1.500 / 1M
Total de tokens de entrada	76,797	32,715
Tokens de salida	13,325	2,286
Tokens de razonamiento	0	9,166
Tiempo de respuesta (promedio)	4.74s	2.77s
Tiempo de respuesta (máximo)	29.46s	11.91s
Tiempo de respuesta (total)	99.46s	58.12s

Generación showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 Claude Sonnet 5

none

Coste: $0.061
Tiempo: 53.7s
Tokens: 6,172 tok

#84 Gemini 3.1 Flash Lite Preview

low

Coste: $0.002
Tiempo: 3.7s
Tokens: 1,203 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 5	5.3	10.0	25.0%	0		3.60s	834	1,813	0
Gemini 3.1 Flash Lite Preview	8.3	10.0	75.0%	0		2.12s	506	462	1,638

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 5	4.6	7.9	22.2%	1		3.67s	10,590	1,864	0
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		1.39s	8,138	660	1,060

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 5	3.0	10.0	0.0%	0		29.46s	38,775	6,340	0
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		11.91s	8,381	225	762

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 5	10.0	10.0	100.0%	0		3.01s	10,503	309	0
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.00s	7,455	291	696

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 5	5.3	7.2	44.4%	1		3.28s	975	933	0
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		2.36s	641	18	1,212

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 5	4.7	3.1	33.3%	1		2.81s	708	272	0
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		1.54s	490	69	384

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 5	6.4	10.0	50.0%	0		2.58s	909	103	0
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.49s	621	72	753

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 5	6.0	7.4	55.6%	1		3.22s	894	778	0
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.69s	566	243	1,248

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 5	10.0	10.0	100.0%	0		6.80s	12,351	522	0
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		9.54s	5,757	237	993

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 5	3.0	10.0	0.0%	0		4.31s	258	391	0
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		1.35s	160	9	420

Comparación rápida

Cambiar par de comparación