Ranking de modelos de Específico do domínio

Veja quais modelos de IA vão melhor em Específico do domínio, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Tempo de resposta (médio) ↓.

Modelos exibidos

Média de Pontuação de Específico do domínio

4.7

Melhor modelo

Kimi K3 5.9

Motivos de falha

Com motivo de falha Resposta incorreta421 Com motivo de falha Tempo esgotado43 Com motivo de falha Formatação extra17 Com motivo de falha Sem resposta8 Com motivo de falha Erro de API7 Com motivo de falha Não seguiu as instruções1

216/216

Posição	Modelo	Empresa	Pontuação de Específico do domínio	Pontuação	Custo total	Testes corretos	Tempo de resposta (médio)
#54	GPT-5.6 Luna medium	OpenAI	5.3	7.6	$0.352	1/3	17.4s
Total de testes 3 Testes errados 2 Custo total $0.352 Tempo de resposta (médio) 17.4s
#146	Nemotron 3 Super medium	NVIDIA	2.9	5.7	$0.055	0/3	16.2s
Total de testes 3 Testes errados 3 Custo total $0.055 Tempo de resposta (médio) 16.2s
#3	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.742	3/3	15.3s
Total de testes 3 Testes errados 0 Custo total $0.742 Tempo de resposta (médio) 15.3s
#177	North Mini Code none	Cohere	3.0	5.1	$0.000	0/3	14.7s
Total de testes 3 Testes errados 3 Custo total $0.000 Tempo de resposta (médio) 14.7s
#89	Qwen3.6 Flash medium	Qwen	3.5	6.9	$0.738	0/3	14.6s
Total de testes 3 Testes errados 3 Custo total $0.738 Tempo de resposta (médio) 14.6s
#17	Claude Opus 4.8 medium	Anthropic	5.3	8.8	$1.931	1/3	14.6s
Total de testes 3 Testes errados 2 Custo total $1.931 Tempo de resposta (médio) 14.6s
#4	Gemini 3.5 Flash high	Google	7.6	9.5	$1.976	2/3	14.1s
Total de testes 3 Testes errados 1 Custo total $1.976 Tempo de resposta (médio) 14.1s
#58	GPT-5.3 Chat none	OpenAI	3.5	7.5	$0.571	0/3	13.0s
Total de testes 3 Testes errados 3 Custo total $0.571 Tempo de resposta (médio) 13.0s
#1	Gemini 3.6 Flash medium	Google	8.2	9.9	$0.831	2/3	12.6s
Total de testes 3 Testes errados 1 Custo total $0.831 Tempo de resposta (médio) 12.6s
#204	Laguna Xs.2 medium	Poolside	4.1	4.1	$0.015	0/3	11.1s
Total de testes 3 Testes errados 3 Custo total $0.015 Tempo de resposta (médio) 11.1s
#83	Gemini 3.5 Flash none	Google	7.6	7.0	$1.079	2/3	10.6s
Total de testes 3 Testes errados 1 Custo total $1.079 Tempo de resposta (médio) 10.6s
#190	Hunter Alpha medium	OpenRouter	3.0	4.7	$0.000	0/3	10.5s
Total de testes 3 Testes errados 3 Custo total $0.000 Tempo de resposta (médio) 10.5s
#123	GPT-5.6 Luna low	OpenAI	3.6	6.2	$0.249	0/3	10.0s
Total de testes 3 Testes errados 3 Custo total $0.249 Tempo de resposta (médio) 10.0s
#115	Mimo V2 PRO medium	Xiaomi	5.3	6.3	$0.333	1/3	8.82s
Total de testes 3 Testes errados 2 Custo total $0.333 Tempo de resposta (médio) 8.82s
#152	Owl Alpha medium	Openrouter	5.3	5.6	$0.000	1/3	8.58s
Total de testes 3 Testes errados 2 Custo total $0.000 Tempo de resposta (médio) 8.58s

Ranking de Específico do domínio

Filtrar modelos

Melhores modelos por Pontuação de Específico do domínio

Pontuação de Específico do domínio vs custo total

Melhores modelos por Tempo de resposta (médio)