AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Hunter Alpha

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-15

Métrica	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Lanzamiento: 2026-03-03	Hunter Alpha Hunter Alpha medium Lanzamiento: Fecha de lanzamiento desconocida

Métrica	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Lanzamiento: 2026-03-03	Hunter Alpha Hunter Alpha medium Lanzamiento: Fecha de lanzamiento desconocida
Rango	#21	#32
Puntuación	7.9	7.1
Consistencia	10.0	7.6
Costo por resultado	0.177	0.000
Costo total	$0.020	$0.000
Pruebas correctas
Tasa de aciertos por intento	68.8%	68.8%
Pruebas inestables	0	5
Ejecuciones totales	48	48
Tokens de salida	1,611	4,686
Tokens de razonamiento	7,272	17,821
Tiempo de respuesta (promedio)	3.36s	10.71s
Tiempo de respuesta (máximo)	11.91s	30.53s
Tiempo de respuesta (total)	53.84s	171.41s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	7.7	10.0	66.7%	0		2.18s	456	1,224
Hunter Alpha	8.2	7.2	88.9%	1		4.93s	441	1,003

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		11.91s	225	762
Hunter Alpha	4.7	1.6	66.7%	1		30.53s	792	3,456

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.00s	291	696
Hunter Alpha	10.0	10.0	100.0%	0		23.16s	1,488	8,017

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		2.36s	18	1,212
Hunter Alpha	3.0	10.0	0.0%	0		10.52s	892	2,406

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		1.54s	69	384
Hunter Alpha	7.0	3.7	66.7%	1		6.44s	116	260

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.49s	72	753
Hunter Alpha	9.9	10.0	100.0%	0		4.18s	208	465

Puzzle Solving	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		2.76s	243	1,248
Hunter Alpha	6.1	4.7	66.7%	2		5.36s	441	1,310

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de salida	Tokens de razonamiento
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		9.54s	237	993
Hunter Alpha	10.0	10.0	100.0%	0		17.33s	308	904

Comparación rápida

Cambiar par de comparación

Gemini 3.1 Flash Lite PreviewlowvsQwen3.5-Flashmedium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.3 Chatnone Gemini 3.1 Flash Lite PreviewlowvsGLM 5 Turbomedium Gemini 3.1 Flash Lite PreviewlowvsGrok 4.20 Betamedium Gemini 3.1 Flash Lite PreviewlowvsStep 3.5 FlashmediumDisponible gratis Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2-Flashmedium Hunter AlphamediumvsQwen3.5 Plus 2026-02-15none Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2 Chatnone Hunter AlphamediumvsGLM 5none Seed-2.0-MinimediumvsGemini 3.1 Flash Lite Previewlow DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewlow Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2medium