Ranking de modelos de Específico del dominio

Mira qué modelos de IA rinden mejor en Específico del dominio, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Métrica ↑.

Modelos mostrados

Promedio de Puntuación de Específico del dominio

4.7

Mejor modelo

GLM 5 Turbo 2.9

Motivos de fallo

Con motivo de fallo Respuesta incorrecta412 Con motivo de fallo Tiempo agotado43 Con motivo de fallo Formato extra17 Con motivo de fallo Sin respuesta8 Con motivo de fallo Error de API7 Con motivo de fallo No siguió las instrucciones1

210/210

Rango	Modelo	Empresa	Puntuación de Específico del dominio	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#49	GLM 5 Turbo medium	Z.ai	2.9	7.6	$0.323	0/3	71.1s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.323 Tiempo de respuesta (promedio) 71.1s
#69	KAT-Coder-Pro V2.5 high	Kwaipilot	2.9	7.2	$0.482	0/3	35.3s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.482 Tiempo de respuesta (promedio) 35.3s
#76	DeepSeek V3.2 medium	DeepSeek	2.9	7.0	$0.078	0/3	24.3s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.078 Tiempo de respuesta (promedio) 24.3s
#95	Gemma 4 26B A4B medium	Google	2.9	6.6	$0.089	0/3	23.6s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.089 Tiempo de respuesta (promedio) 23.6s
#121	gpt-oss-120b medium	OpenAI	2.9	6.1	$0.019	0/3	50.9s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.019 Tiempo de respuesta (promedio) 50.9s
#140	Nemotron 3 Super medium	NVIDIA	2.9	5.7	$0.050	0/3	16.2s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.050 Tiempo de respuesta (promedio) 16.2s
#180	GPT-5.4 Nano none	OpenAI	2.9	4.8	$0.041	0/3	926ms
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.041 Tiempo de respuesta (promedio) 926ms
#188	Cobuddy medium	Baidu	2.9	4.7	$0.000	0/3	128.2s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.000 Tiempo de respuesta (promedio) 128.2s
#190	MiniMax M2.5 medium	Minimax	2.9	4.6	$0.340	0/3	237.3s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.340 Tiempo de respuesta (promedio) 237.3s
#19	Qwen3.6 Max Preview medium	Qwen	2.9	8.4	$1.143	0/3	95.9s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $1.143 Tiempo de respuesta (promedio) 95.9s
#22	Grok 4.5 medium	X AI	2.9	8.3	$1.928	0/3	198.9s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $1.928 Tiempo de respuesta (promedio) 198.9s
#24	Muse Spark 1.1 low	Meta	2.9	8.3	$0.647	0/3	29.7s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.647 Tiempo de respuesta (promedio) 29.7s
#37	Qwen3.6 Plus medium	Qwen	2.9	7.8	$0.405	0/3	29.6s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.405 Tiempo de respuesta (promedio) 29.6s
#40	Claude Sonnet 4.6 medium	Anthropic	2.9	7.8	$2.057	0/3	0ms
Pruebas totales 3 Pruebas incorrectas 3 Costo total $2.057 Tiempo de respuesta (promedio) 0ms
#60	LongCat 2.0 medium	Meituan	2.9	7.4	$0.478	0/3	339.9s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.478 Tiempo de respuesta (promedio) 339.9s

Ranking de Específico del dominio

Filtrar modelos

Mejores modelos por Puntuación de Específico del dominio

Puntuación de Específico del dominio vs costo total

Mejores modelos por Tiempo de respuesta (promedio)