AI BENCHY
Advertise here
#78

Qwen3.6 27B

Qwen Lanzamiento: 2026-04-20 Probado el: 2026-04-27 21:31 qwen/qwen3.6-27b::none
(medium) (none)

Resumen

Qwen3.6 27B obtiene 5.9 en AI BENCHY y ocupa el puesto #78. Tiene fiabilidad 10.0, una tasa de aciertos de 54.6%, coste total de $0.027 y tiempo medio de respuesta de 4.19s.

Qué hace único a Qwen3.6 27B: Destaca más en Programación, donde ocupa #1, mientras que Trucos anti-IA es su área más débil con #13.

Consistencia

6.9

Fiabilidad

10.0

Total de tokens de salida

2,924

Total de tokens de entrada

0

Precio de entrada

$0.500 / 1M

Precio de salida

$2.000 / 1M

Pruebas correctas

Pruebas incorrectas: 7

Tasa de aciertos por intento: 54.6%

Pruebas inestables

4

Pruebas inestables tuvieron resultados mixtos entre ejecuciones (al menos un acierto y un fallo).

Tiempo de respuesta (promedio)

4.19s

Tiempo de respuesta (máximo): 10.18s

Tiempo de respuesta (total): 46.05s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#78 Qwen3.6 27B

none
Cost
$0.009
Time
83.0s
Tokens
4,549 tok

Historial de ejecuciones

Probado el Puntuación Fiabilidad Pruebas correctas Costo total Comparar
2026-06-04 13:16 Prueba nueva añadida 5.6 10.0 $0.028 Comparar
2026-05-21 23:48 Suite modificada 5.8 10.0 $0.032 Comparar
2026-04-27 21:46 Prueba nueva añadida 6.0 10.0 $0.031 Comparar
2026-04-27 21:31 Primera ejecución registrada 5.9 10.0 $0.027 Ejecución actual

Comparación de ejecuciones

EjecuciónPuntuaciónConsistenciaFiabilidadPruebas correctasPruebas inestablesTotal de tokens de salidaTotal de tokens de entradaCosto totalTiempo de respuesta (promedio)
2026-04-27 21:31 · Primera ejecución registrada5.96.910.04/1142,9240$0.0274.19s
2026-04-27 21:46 · Prueba nueva añadida6.07.210.07/1863,7750$0.0314.00s
Diferencia-0.1-0.30.0-3-2-8510-$0.004+186ms

Estas dos ejecuciones usaron suites de benchmark distintas, así que las diferencias reflejan tanto cambios del modelo como de la suite.

Gráficos

Elige el primer modelo y luego haz clic en un segundo modelo para abrir una página lado a lado.

Total de tokens de salida

Puntuación vs Total de tokens de salida

Comparación rápida

Desglose por categoría

Categoría Puntuación Consistencia Pruebas correctas
Trucos anti-IA 4.0 1.6
Programación 10.0 10.0
Combinado 3.0 10.0
Análisis y extracción de datos 9.9 10.0
Específico del dominio 6.5 10.0
Inteligencia general 5.2 9.9
Seguimiento de instrucciones 2.8 1.6
Llamada de herramientas 9.5 10.0

Modelos comparados