Navegación
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs Qwen: Qwen3.5-Flash

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-03-17

Métrica Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview medium Lanzamiento: 2026-03-03 Qwen3.5-Flash Qwen3.5-Flash medium Lanzamiento: 2026-02-24
Rango #14 #19
Puntuación 8.1 8.0
Consistencia 10.0 7.6
Costo por resultado 0.413 0.688
Costo total $0.050 $0.076
Pruebas correctas
Tasa de aciertos por intento 70.6% 82.4%
Pruebas inestables 0 5
Ejecuciones totales 51 51
Tokens de salida 1,737 1,827
Tokens de razonamiento 26,346 179,299
Tiempo de respuesta (promedio) 3.70s 67.96s
Tiempo de respuesta (máximo) 14.93s 234.29s
Tiempo de respuesta (total) 62.97s 1155.28s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite Preview 9.1 10.0 75.0% 0 2.33s 570 4,305
Qwen3.5-Flash 10.0 10.0 100.0% 0 59.11s 383 32,992
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 14.93s 327 7,347
Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 483 8,270
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 2.29s 279 2,952
Qwen3.5-Flash 7.3 5.9 83.3% 1 56.99s 235 16,237
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 4.21s 18 5,325
Qwen3.5-Flash 5.3 7.2 44.4% 1 146.50s 58 43,615
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.16s 96 1,488
Qwen3.5-Flash 6.1 3.1 66.7% 1 40.05s 99 38,486
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.91s 72 2,121
Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 98 14,139
Puzzle Solving Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite Preview 7.7 10.0 66.7% 0 3.58s 141 1,896
Qwen3.5-Flash 6.4 4.4 77.8% 2 56.74s 162 24,276
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.80s 234 912
Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 309 1,284

Comparación rápida

Cambiar par de comparación