Navegación
AI BENCHY
Advertise here

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite vs Qwen: Qwen3.6 27B

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-08

Métrica Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal Lanzamiento: 2026-05-08 Qwen3.6 27B Qwen3.6 27B medium Lanzamiento: 2026-04-20
Puntuación 6.8 6.8
Rango #68 #70
Fiabilidad 10.0 10.0
Consistencia 8.7 8.0
Pruebas correctas
Tasa de aciertos por intento 59.7% 61.4%
Pruebas inestables 3 5
Ejecuciones totales 57 57
Costo por resultado 0.111 2.543
Costo total $0.012 $0.229
Precio de entrada $0.250 / 1M $0.320 / 1M
Precio de salida $1.500 / 1M $3.200 / 1M
Tokens de salida 2,457 8,680
Tokens de razonamiento 0 96,890
Tiempo de respuesta (promedio) 1.41s 52.13s
Tiempo de respuesta (máximo) 4.49s 168.22s
Tiempo de respuesta (total) 26.72s 990.48s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 8.3 10.0 75.0% 0 1.10s 639 0
Qwen3.6 27B 8.3 10.0 75.0% 0 12.62s 582 4,311
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.31s 636 0
Qwen3.6 27B 10.0 10.0 100.0% 0 168.22s 433 17,861
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 2.53s 357 0
Qwen3.6 27B 7.0 3.7 66.7% 1 83.07s 2,088 14,689
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 1.04s 279 0
Qwen3.6 27B 3.5 1.4 50.0% 2 37.30s 568 9,404
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 2.9 7.2 11.1% 1 1.02s 15 0
Qwen3.6 27B 2.9 7.2 11.1% 1 73.38s 3,510 20,352
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 4.0 10.0 0.0% 0 791ms 63 0
Qwen3.6 27B 6.5 3.4 66.7% 1 39.53s 81 3,045
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 932ms 72 0
Qwen3.6 27B 10.0 10.0 100.0% 0 37.96s 346 6,548
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 6.0 4.6 66.7% 2 2.15s 153 0
Qwen3.6 27B 7.7 10.0 66.7% 0 60.21s 281 11,919
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 10.0 10.0 100.0% 0 3.51s 234 0
Qwen3.6 27B 10.0 10.0 100.0% 0 16.88s 390 2,954
Cultura general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
Gemini 3.1 Flash Lite 3.0 10.0 0.0% 0 724ms 9 0
Qwen3.6 27B 3.0 10.0 0.0% 0 80.99s 401 5,807

Comparación rápida

Cambiar par de comparación