AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com
#37

Qwen3.6 27B

Qwen Lanzamiento: 2026-04-20 Probado el: 2026-04-27 21:31 qwen/qwen3.6-27b::medium
(medium) (none)

Resumen

Qwen3.6 27B obtiene 7.9 en AI BENCHY y ocupa el puesto #37. Tiene fiabilidad 10.0, una tasa de aciertos de 77.8%, coste total de $0.043 y tiempo medio de respuesta de 25.56s.

Consistencia

8.5

Fiabilidad

10.0

Total de tokens de salida

21,553

Total de tokens de entrada

0

Precio de entrada

$0.500 / 1M

Precio de salida

$2.000 / 1M

Pruebas correctas

Pruebas incorrectas: 2

Tasa de aciertos por intento: 77.8%

Pruebas inestables

1

Pruebas inestables tuvieron resultados mixtos entre ejecuciones (al menos un acierto y un fallo).

Tiempo de respuesta (promedio)

25.56s

Tiempo de respuesta (máximo): 47.48s

Tiempo de respuesta (total): 153.33s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#37 Qwen3.6 27B

medium
Cost
$0.009
Time
39.6s
Tokens
3,090 tok

Historial de ejecuciones

Probado el Puntuación Fiabilidad Pruebas correctas Costo total Comparar
2026-06-04 13:21 Prueba nueva añadida 6.8 10.0 $0.444 Comparar
2026-05-21 23:59 Suite modificada 6.6 9.9 $0.272 Comparar
2026-04-27 21:48 Prueba nueva añadida 7.0 10.0 $0.209 Comparar
2026-04-27 21:31 Primera ejecución registrada 7.9 10.0 $0.043 Ejecución actual

Comparación de ejecuciones

EjecuciónPuntuaciónConsistenciaFiabilidadPruebas correctasPruebas inestablesTotal de tokens de salidaTotal de tokens de entradaCosto totalTiempo de respuesta (promedio)
2026-04-27 21:31 · Primera ejecución registrada7.98.510.04/6121,5530$0.04325.56s
2026-05-21 23:59 · Suite modificada6.68.19.99/205118,7040$0.27257.65s
Diferencia+1.3+0.4+0.1-5-4-971510-$0.229-32096ms

Estas dos ejecuciones usaron suites de benchmark distintas, así que las diferencias reflejan tanto cambios del modelo como de la suite.

Gráficos

Elige el primer modelo y luego haz clic en un segundo modelo para abrir una página lado a lado.

Total de tokens de salida

Puntuación vs Total de tokens de salida

Comparación rápida

Desglose por categoría

Categoría Puntuación Consistencia Pruebas correctas
Trucos anti-IA 10.0 10.0
Análisis y extracción de datos 4.3 1.2
Específico del dominio 3.0 10.0
Seguimiento de instrucciones 10.0 10.0
Llamada de herramientas 10.0 10.0

Modelos comparados