Navegación
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs Qwen: Qwen3.5-Flash

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-08

Métrica Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite low Lanzamiento: 2026-05-08 Qwen3.5-Flash Qwen3.5-Flash medium Lanzamiento: 2026-02-24
Puntuación 7.6 7.6
Rango #44 #45
Fiabilidad 10.0 6.7
Consistencia 9.2 7.5
Pruebas correctas
Tasa de aciertos por intento 68.4% 77.2%
Pruebas inestables 2 6
Ejecuciones totales 57 57
Costo por resultado 0.203 0.807
Costo total $0.025 $0.089
Precio de entrada $0.250 / 1M $0.065 / 1M
Precio de salida $1.500 / 1M $0.260 / 1M
Tokens de salida 2,702 2,105
Tokens de razonamiento 8,596 228,936
Tiempo de respuesta (promedio) 1.92s 65.79s
Tiempo de respuesta (máximo) 5.66s 234.29s
Tiempo de respuesta (total) 36.49s 1250.00s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 7.3 6.2 75.0% 2 1.84s 1,013 1,548
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 383 32,992
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.46s 441 408
Qwen3.5-Flash 4.7 1.6 66.7% 1 45.75s 246 12,600
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 4.48s 348 975
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 483 8,270
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.44s 291 697
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 235 16,237
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 5.3 10.0 33.3% 0 1.52s 15 1,214
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 58 43,615
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 1.37s 69 438
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 99 38,486
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.52s 72 760
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 98 14,139
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.40s 210 1,191
Qwen3.5-Flash 6.6 4.6 77.8% 2 56.74s 162 24,276
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 5.66s 234 945
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 309 1,284
Cultura general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 1.46s 9 420
Qwen3.5-Flash 3.0 10.0 0.0% 0 48.98s 32 37,037

Comparación rápida

Cambiar par de comparación