Ranking de modelos de Específico do domínio

Veja quais modelos de IA vão melhor em Específico do domínio, quais permanecem confiáveis e onde aparecem as maiores diferenças.

Modelos exibidos

Média de Pontuação de Específico do domínio

4.7

Melhor modelo

Gemini 3.6 Flash 10.0

Motivos de falha

Com motivo de falha Resposta incorreta421 Com motivo de falha Tempo esgotado43 Com motivo de falha Formatação extra17 Com motivo de falha Sem resposta8 Com motivo de falha Erro de API7 Com motivo de falha Não seguiu as instruções1

216/216

Posição	Modelo	Empresa	Pontuação de Específico do domínio	Pontuação	Custo total	Testes corretos	Tempo de resposta (médio)
#160	MiMo-V2.5-Pro none	Xiaomi	5.3	5.5	$0.068	1/3	877ms
Total de testes 3 Testes errados 2 Custo total $0.068 Tempo de resposta (médio) 877ms
#161	Kimi K2.5 none	Moonshot AI	5.3	5.5	$0.127	1/3	4.38s
Total de testes 3 Testes errados 2 Custo total $0.127 Tempo de resposta (médio) 4.38s
#163	Mimo V2 Omni none	Xiaomi	5.3	5.5	$0.021	1/3	2.10s
Total de testes 3 Testes errados 2 Custo total $0.021 Tempo de resposta (médio) 2.10s
#166	Laguna XS 2.1 none	Poolside	5.3	5.3	$0.008	1/3	364ms
Total de testes 3 Testes errados 2 Custo total $0.008 Tempo de resposta (médio) 364ms
#169	Gemini 3.1 Flash Lite Preview high	Google	5.3	5.3	$2.310	1/3	127.6s
Total de testes 3 Testes errados 2 Custo total $2.310 Tempo de resposta (médio) 127.6s
#170	Inkling none	Thinkingmachines	5.3	5.2	$0.147	1/3	1.45s
Total de testes 3 Testes errados 2 Custo total $0.147 Tempo de resposta (médio) 1.45s
#171	Mistral Small 4 none	Mistral	5.3	5.1	$0.022	1/3	367ms
Total de testes 3 Testes errados 2 Custo total $0.022 Tempo de resposta (médio) 367ms
#172	Qwen3 Coder Next none	Qwen	5.3	5.1	$0.025	1/3	962ms
Total de testes 3 Testes errados 2 Custo total $0.025 Tempo de resposta (médio) 962ms
#176	GLM 5 Turbo none	Z.ai	5.3	5.1	$0.047	1/3	1.97s
Total de testes 3 Testes errados 2 Custo total $0.047 Tempo de resposta (médio) 1.97s
#189	Trinity Large Preview none	Arcee AI	5.3	4.8	$0.008	1/3	877ms
Total de testes 3 Testes errados 2 Custo total $0.008 Tempo de resposta (médio) 877ms
#193	Qwen3 Coder Next medium	Qwen	5.3	4.7	$0.032	1/3	638ms
Total de testes 3 Testes errados 2 Custo total $0.032 Tempo de resposta (médio) 638ms
#202	Hunter Alpha none	OpenRouter	5.3	4.2	$0.000	1/3	2.33s
Total de testes 3 Testes errados 2 Custo total $0.000 Tempo de resposta (médio) 2.33s
#211	Laguna Xs.2 none	Poolside	5.3	3.8	$0.004	1/3	371ms
Total de testes 3 Testes errados 2 Custo total $0.004 Tempo de resposta (médio) 371ms
#5	GPT-5.6 Sol low	OpenAI	5.3	9.5	$0.971	1/3	29.1s
Total de testes 3 Testes errados 2 Custo total $0.971 Tempo de resposta (médio) 29.1s
#8	GPT-5.6 Sol high	OpenAI	5.3	9.4	$1.234	1/3	39.5s
Total de testes 3 Testes errados 2 Custo total $1.234 Tempo de resposta (médio) 39.5s

Ranking de Específico do domínio

Filtrar modelos

Melhores modelos por Pontuação de Específico do domínio

Pontuação de Específico do domínio vs custo total

Melhores modelos por Tempo de resposta (médio)