AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Fallos por categoría de AI BENCHY

Análisis y extracción de datos: Formato extra

Análisis y extracción de datos
Formato extra

Mira qué modelos de IA tienen más probabilidades de caer en Formato extra dentro de Análisis y extracción de datos, para detectar puntos débiles más rápido. Ordenar por: Pruebas correctas ↑.

Modelos mostrados

4

Fallos totales

4

Modelo más afectado

MiMo-V2.5 1
Rango Modelo Empresa Cantidad de Formato extra Puntuación de categoría Pruebas correctas Tiempo de respuesta (promedio)
#56 MiMo-V2.5 medium Xiaomi 1 2.7 0/2 6.33s
#152 MiMo-V2-Flash none Xiaomi 1 2.9 0/2 19.7s
#161 Qwen3.5-9B medium Qwen 1 3.6 0/2 87.3s
#143 MiMo-V2.5 none Xiaomi 1 6.5 1/2 1.01s

Mejores modelos por Cantidad de Formato extra

Cantidad de Formato extra vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado