Fallos por categoría de AI BENCHY
Llamada de herramientas
Sin respuesta
Llamada de herramientas
Sin respuesta
Mira qué modelos de IA tienen más probabilidades de caer en Sin respuesta dentro de Llamada de herramientas, para detectar puntos débiles más rápido. Ordenar por: Pruebas correctas ↑.
Motivos de fallo relacionados
Categorías relacionadas
| Rango | Modelo | Empresa | Cantidad de Sin respuesta | Puntuación de categoría | Pruebas correctas | Tiempo de respuesta (promedio) |
|---|---|---|---|---|---|---|
| #27 | GPT-5.2 medium | OpenAI | 1 | 10.0 | 0/1 | 10.3s |
| #30 | Grok 4.1 Fast medium | X AI | 1 | 10.0 | 0/1 | 27.7s |