AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#78

Qwen3.6 27B

Qwen Lanzamiento: 2026-04-20 Probado el: 2026-04-27 21:31 qwen/qwen3.6-27b::none
(medium) (none)

Consistencia

6.9

Fiabilidad

10.0

Costo total

$0.027

Total de tokens de salida

2,924

Precio de entrada

$0.500 / 1M

Precio de salida

$2.000 / 1M

Pruebas correctas

Pruebas incorrectas: 7

Tasa de aciertos por intento: 54.6%

Pruebas inestables

4

Pruebas inestables tuvieron resultados mixtos entre ejecuciones (al menos un acierto y un fallo).

Tiempo de respuesta (promedio)

4.19s

Tiempo de respuesta (máximo): 10.18s

Tiempo de respuesta (total): 46.05s

Historial de ejecuciones

Probado el Puntuación Fiabilidad Pruebas correctas Costo total Comparar
2026-04-27 21:46 Prueba nueva añadida 6.0 10.0 $0.031 Comparar
2026-04-27 21:31 Primera ejecución registrada 5.9 10.0 $0.027 Ejecución actual

Comparación de ejecuciones

EjecuciónPuntuaciónConsistenciaFiabilidadPruebas correctasPruebas inestablesTotal de tokens de salidaCosto totalTiempo de respuesta (promedio)
2026-04-27 21:31 · Primera ejecución registrada5.96.910.04/1142,924$0.0274.19s
2026-04-27 21:46 · Prueba nueva añadida6.07.210.07/1863,775$0.0314.00s
Diferencia-0.1-0.30.0-3-2-851-$0.004+186ms

Estas dos ejecuciones usaron suites de benchmark distintas, así que las diferencias reflejan tanto cambios del modelo como de la suite.

Gráficos

Elige el primer modelo y luego haz clic en un segundo modelo para abrir una página lado a lado.

Total de tokens de salida

Puntuación vs Total de tokens de salida

Comparación rápida

Desglose por categoría

Categoría Puntuación Consistencia Pruebas correctas
Trucos anti-IA 4.0 1.6
Programación 10.0 10.0
Combinado 3.0 10.0
Análisis y extracción de datos 9.9 10.0
Específico del dominio 6.5 10.0
Inteligencia general 5.2 9.9
Seguimiento de instrucciones 2.8 1.6
Llamada de herramientas 9.5 10.0

Modelos comparados