Ranking de modelos de Específico do domínio

Veja quais modelos de IA vão melhor em Específico do domínio, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Tempo de resposta (médio) ↑.

Modelos exibidos

Média de Pontuação de Específico do domínio

4.7

Melhor modelo

Claude Sonnet 4.6 2.9

Motivos de falha

Com motivo de falha Resposta incorreta421 Com motivo de falha Tempo esgotado43 Com motivo de falha Formatação extra17 Com motivo de falha Sem resposta8 Com motivo de falha Erro de API7 Com motivo de falha Não seguiu as instruções1

216/216

Posição	Modelo	Empresa	Pontuação de Específico do domínio	Pontuação	Custo total	Testes corretos	Tempo de resposta (médio)
#104	Gemini 3.5 Flash-Lite medium	Google	2.9	6.5	$0.369	0/3	6.62s
Total de testes 3 Testes errados 3 Custo total $0.369 Tempo de resposta (médio) 6.62s
#139	Gemini 3 PRO Preview medium	Google	5.3	6.0	$0.385	1/3	7.01s
Total de testes 3 Testes errados 2 Custo total $0.385 Tempo de resposta (médio) 7.01s
#167	Qwen3.6 35B A3B none	Qwen	3.5	5.3	$0.061	0/3	7.45s
Total de testes 3 Testes errados 3 Custo total $0.061 Tempo de resposta (médio) 7.45s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	2.9	5.6	$0.077	0/3	7.47s
Total de testes 3 Testes errados 3 Custo total $0.077 Tempo de resposta (médio) 7.47s
#65	Gemini 3 Flash Preview low	Google	5.3	7.4	$0.177	1/3	8.05s
Total de testes 3 Testes errados 2 Custo total $0.177 Tempo de resposta (médio) 8.05s
#59	GPT-5.6 Terra low	OpenAI	5.3	7.5	$0.519	1/3	8.34s
Total de testes 3 Testes errados 2 Custo total $0.519 Tempo de resposta (médio) 8.34s
#152	Owl Alpha medium	Openrouter	5.3	5.6	$0.000	1/3	8.58s
Total de testes 3 Testes errados 2 Custo total $0.000 Tempo de resposta (médio) 8.58s
#115	Mimo V2 PRO medium	Xiaomi	5.3	6.3	$0.333	1/3	8.82s
Total de testes 3 Testes errados 2 Custo total $0.333 Tempo de resposta (médio) 8.82s
#123	GPT-5.6 Luna low	OpenAI	3.6	6.2	$0.249	0/3	10.0s
Total de testes 3 Testes errados 3 Custo total $0.249 Tempo de resposta (médio) 10.0s
#190	Hunter Alpha medium	OpenRouter	3.0	4.7	$0.000	0/3	10.5s
Total de testes 3 Testes errados 3 Custo total $0.000 Tempo de resposta (médio) 10.5s
#83	Gemini 3.5 Flash none	Google	7.6	7.0	$1.079	2/3	10.6s
Total de testes 3 Testes errados 1 Custo total $1.079 Tempo de resposta (médio) 10.6s
#204	Laguna Xs.2 medium	Poolside	4.1	4.1	$0.015	0/3	11.1s
Total de testes 3 Testes errados 3 Custo total $0.015 Tempo de resposta (médio) 11.1s
#1	Gemini 3.6 Flash medium	Google	8.2	9.9	$0.831	2/3	12.6s
Total de testes 3 Testes errados 1 Custo total $0.831 Tempo de resposta (médio) 12.6s
#58	GPT-5.3 Chat none	OpenAI	3.5	7.5	$0.571	0/3	13.0s
Total de testes 3 Testes errados 3 Custo total $0.571 Tempo de resposta (médio) 13.0s
#4	Gemini 3.5 Flash high	Google	7.6	9.5	$1.976	2/3	14.1s
Total de testes 3 Testes errados 1 Custo total $1.976 Tempo de resposta (médio) 14.1s

Ranking de Específico do domínio

Filtrar modelos

Melhores modelos por Pontuação de Específico do domínio

Pontuação de Específico do domínio vs custo total

Melhores modelos por Tempo de resposta (médio)