Ranking de modelos de Conhecimentos gerais

Categoria AI BENCHY

Veja quais modelos de IA vão melhor em Conhecimentos gerais, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Custo total ↑.

Modelos exibidos

Média de Pontuação de Conhecimentos gerais

3.1

Melhor modelo

North Mini Code 3.0

Motivos de falha

Com motivo de falha Resposta incorreta133 Com motivo de falha Erro de API13 Com motivo de falha Sem resposta8

169/169

Posição	Modelo	Empresa	Pontuação de Conhecimentos gerais	Pontuação	Custo total	Testes corretos	Tempo de resposta (médio)
#117	DeepSeek V4 Flash none	DeepSeek	3.0	5.5	$0.007	0/1	3.07s
Total de testes 1 Testes errados 1 Custo total $0.007 Tempo de resposta (médio) 3.07s
#161	Grok 4.1 Fast none	X AI	3.0	4.0	$0.008	0/1	731ms
Total de testes 1 Testes errados 1 Custo total $0.008 Tempo de resposta (médio) 731ms
#137	Trinity Large Preview none	Arcee AI	3.0	5.0	$0.008	0/1	777ms
Total de testes 1 Testes errados 1 Custo total $0.008 Tempo de resposta (médio) 777ms
#148	Qwen3 Coder Next medium	Qwen	3.0	4.7	$0.008	0/1	399ms
Total de testes 1 Testes errados 1 Custo total $0.008 Tempo de resposta (médio) 399ms
#130	Qwen3 Coder Next none	Qwen	3.0	5.1	$0.009	0/1	601ms
Total de testes 1 Testes errados 1 Custo total $0.009 Tempo de resposta (médio) 601ms
#164	gpt-oss-120b none	OpenAI	3.0	4.0	$0.010	0/1	47.3s
Total de testes 1 Testes errados 1 Custo total $0.010 Tempo de resposta (médio) 47.3s
#145	GPT-5.4 Nano none	OpenAI	3.0	4.8	$0.011	0/1	773ms
Total de testes 1 Testes errados 1 Custo total $0.011 Tempo de resposta (médio) 773ms
#151	Mercury 2 none	Inception	3.0	4.6	$0.011	0/1	548ms
Total de testes 1 Testes errados 1 Custo total $0.011 Tempo de resposta (médio) 548ms
#103	Qwen3.5-35B-A3B none	Qwen	3.0	5.9	$0.012	0/1	493ms
Total de testes 1 Testes errados 1 Custo total $0.012 Tempo de resposta (médio) 493ms
#78	gpt-oss-120b medium	OpenAI	3.0	6.7	$0.013	0/1	26.5s
Total de testes 1 Testes errados 1 Custo total $0.013 Tempo de resposta (médio) 26.5s
#96	Gemini 3.1 Flash Lite none	Google	3.0	6.1	$0.013	0/1	733ms
Total de testes 1 Testes errados 1 Custo total $0.013 Tempo de resposta (médio) 733ms
#94	Gemini 3.1 Flash Lite minimal	Google	3.0	6.1	$0.013	0/1	724ms
Total de testes 1 Testes errados 1 Custo total $0.013 Tempo de resposta (médio) 724ms
#102	Qwen3.6 Flash none	Qwen	3.0	6.0	$0.015	0/1	649ms
Total de testes 1 Testes errados 1 Custo total $0.015 Tempo de resposta (médio) 649ms
#104	Qwen3.5-27B none	Qwen	3.0	5.9	$0.015	0/1	599ms
Total de testes 1 Testes errados 1 Custo total $0.015 Tempo de resposta (médio) 599ms
#93	Gemini 2.5 Flash none	Google	3.0	6.2	$0.016	0/1	1.15s
Total de testes 1 Testes errados 1 Custo total $0.016 Tempo de resposta (médio) 1.15s

Ranking de Conhecimentos gerais

Filtrar modelos

Melhores modelos por Pontuação de Conhecimentos gerais

Pontuação de Conhecimentos gerais vs custo total

Melhores modelos por Tempo de resposta (médio)