Ranking de modelos de Específico del dominio

Mira qué modelos de IA rinden mejor en Específico del dominio, cuáles se mantienen fiables y dónde aparecen las mayores diferencias.

Modelos mostrados

Promedio de Puntuación de Específico del dominio

4.7

Mejor modelo

Gemini 3.6 Flash 10.0

Motivos de fallo

Con motivo de fallo Respuesta incorrecta421 Con motivo de fallo Tiempo agotado43 Con motivo de fallo Formato extra17 Con motivo de fallo Sin respuesta8 Con motivo de fallo Error de API7 Con motivo de fallo No siguió las instrucciones1

216/216

Rango	Modelo	Empresa	Puntuación de Específico del dominio	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#160	MiMo-V2.5-Pro none	Xiaomi	5.3	5.5	$0.068	1/3	877ms
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.068 Tiempo de respuesta (promedio) 877ms
#161	Kimi K2.5 none	Moonshot AI	5.3	5.5	$0.127	1/3	4.38s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.127 Tiempo de respuesta (promedio) 4.38s
#163	Mimo V2 Omni none	Xiaomi	5.3	5.5	$0.021	1/3	2.10s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.021 Tiempo de respuesta (promedio) 2.10s
#166	Laguna XS 2.1 none	Poolside	5.3	5.3	$0.008	1/3	364ms
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.008 Tiempo de respuesta (promedio) 364ms
#169	Gemini 3.1 Flash Lite Preview high	Google	5.3	5.3	$2.310	1/3	127.6s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $2.310 Tiempo de respuesta (promedio) 127.6s
#170	Inkling none	Thinkingmachines	5.3	5.2	$0.147	1/3	1.45s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.147 Tiempo de respuesta (promedio) 1.45s
#171	Mistral Small 4 none	Mistral	5.3	5.1	$0.022	1/3	367ms
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.022 Tiempo de respuesta (promedio) 367ms
#172	Qwen3 Coder Next none	Qwen	5.3	5.1	$0.025	1/3	962ms
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.025 Tiempo de respuesta (promedio) 962ms
#176	GLM 5 Turbo none	Z.ai	5.3	5.1	$0.047	1/3	1.97s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.047 Tiempo de respuesta (promedio) 1.97s
#189	Trinity Large Preview none	Arcee AI	5.3	4.8	$0.008	1/3	877ms
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.008 Tiempo de respuesta (promedio) 877ms
#193	Qwen3 Coder Next medium	Qwen	5.3	4.7	$0.032	1/3	638ms
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.032 Tiempo de respuesta (promedio) 638ms
#202	Hunter Alpha none	OpenRouter	5.3	4.2	$0.000	1/3	2.33s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.000 Tiempo de respuesta (promedio) 2.33s
#211	Laguna Xs.2 none	Poolside	5.3	3.8	$0.004	1/3	371ms
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.004 Tiempo de respuesta (promedio) 371ms
#5	GPT-5.6 Sol low	OpenAI	5.3	9.5	$0.971	1/3	29.1s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.971 Tiempo de respuesta (promedio) 29.1s
#8	GPT-5.6 Sol high	OpenAI	5.3	9.4	$1.234	1/3	39.5s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $1.234 Tiempo de respuesta (promedio) 39.5s

Ranking de Específico del dominio

Filtrar modelos

Mejores modelos por Puntuación de Específico del dominio

Puntuación de Específico del dominio vs costo total

Mejores modelos por Tiempo de respuesta (promedio)