Ranking de Llamada de herramientas x Sin respuesta

Mira qué modelos de IA tienen más probabilidades de caer en Sin respuesta dentro de Llamada de herramientas, para detectar puntos débiles más rápido. Ordenar por: Pruebas correctas ↑.

Modelos mostrados

Fallos totales

Modelo más afectado

GPT-5.2 1

Motivos de fallo

Error de API17 Llamada de herramienta no válida9 No siguió las instrucciones8 Respuesta incorrecta3 Sin respuesta2

Categorías

Combinado29 Programación18 Cultura general13 Análisis y extracción de datos8 Específico del dominio8 Trucos anti-IA4 Resolución de acertijos3 Llamada de herramientas2 Seguimiento de instrucciones2

2/2

Rango	Modelo	Empresa	Cantidad de Sin respuesta	Puntuación de categoría	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#21	GPT-5.2 medium	OpenAI	1	4.7	$0.951	0/1	10.3s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.951 Tiempo de respuesta (promedio) 10.3s
#185	Grok 4.1 Fast medium	X AI	1	2.8	$0.069	0/1	27.7s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.069 Tiempo de respuesta (promedio) 27.7s

Filtrar modelos

Mejores modelos por Cantidad de Sin respuesta

Cantidad de Sin respuesta vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado

Llamada de herramientas: Sin respuesta

Filtrar modelos

Mejores modelos por Cantidad de Sin respuesta

Cantidad de Sin respuesta vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado