Ranking de modelos de Específico del dominio

Mira qué modelos de IA rinden mejor en Específico del dominio, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Pruebas correctas ↓.

Modelos mostrados

Promedio de Puntuación de Específico del dominio

4.7

Mejor modelo

Gemini 3.6 Flash 10.0

Motivos de fallo

Con motivo de fallo Respuesta incorrecta421 Con motivo de fallo Tiempo agotado43 Con motivo de fallo Formato extra17 Con motivo de fallo Sin respuesta8 Con motivo de fallo Error de API7 Con motivo de fallo No siguió las instrucciones1

216/216

Rango	Modelo	Empresa	Puntuación de Específico del dominio	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#119	MiMo-V2-Flash medium	Xiaomi	5.9	6.3	$0.043	1/3	96.0s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.043 Tiempo de respuesta (promedio) 96.0s
#120	Qwen3.5-Flash medium	Qwen	5.3	6.2	$0.139	1/3	146.5s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.139 Tiempo de respuesta (promedio) 146.5s
#124	Gemini 2.5 Flash none	Google	5.9	6.2	$0.017	1/3	495ms
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.017 Tiempo de respuesta (promedio) 495ms
#129	Inkling low	Thinkingmachines	5.3	6.1	$0.187	1/3	1.99s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.187 Tiempo de respuesta (promedio) 1.99s
#130	Qwen3.6 Flash none	Qwen	5.3	6.1	$0.062	1/3	1.11s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.062 Tiempo de respuesta (promedio) 1.11s
#132	Qwen3.5 Plus 2026-04-20 none	Qwen	5.3	6.1	$0.122	1/3	4.43s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.122 Tiempo de respuesta (promedio) 4.43s
#134	GPT-5 Nano medium	OpenAI	5.2	6.1	$0.114	1/3	204.0s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.114 Tiempo de respuesta (promedio) 204.0s
#135	Nemotron 3 Ultra none	NVIDIA	5.3	6.1	$0.095	1/3	698ms
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.095 Tiempo de respuesta (promedio) 698ms
#136	Step 3.5 Flash medium	Stepfun	5.3	6.0	$0.108	1/3	170.5s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.108 Tiempo de respuesta (promedio) 170.5s
#137	Grok 4.20 Beta medium	X AI	5.3	6.0	$0.750	1/3	21.3s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.750 Tiempo de respuesta (promedio) 21.3s
#138	GPT-5.6 Terra none	OpenAI	5.3	6.0	$0.349	1/3	757ms
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.349 Tiempo de respuesta (promedio) 757ms
#139	Gemini 3 PRO Preview medium	Google	5.3	6.0	$0.385	1/3	7.01s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.385 Tiempo de respuesta (promedio) 7.01s
#141	Hy3 preview high	Tencent	5.3	5.9	$0.048	1/3	109.0s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.048 Tiempo de respuesta (promedio) 109.0s
#143	North Mini Code medium	Cohere	5.3	5.9	$0.000	1/3	71.4s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.000 Tiempo de respuesta (promedio) 71.4s
#144	Kimi K2.6 none	Moonshot AI	5.3	5.8	$0.184	1/3	1.48s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.184 Tiempo de respuesta (promedio) 1.48s

Ranking de Específico del dominio

Filtrar modelos

Mejores modelos por Puntuación de Específico del dominio

Puntuación de Específico del dominio vs costo total

Mejores modelos por Tiempo de respuesta (promedio)