Ranking de modelos de Conhecimentos gerais

Categoria AI BENCHY

Veja quais modelos de IA vão melhor em Conhecimentos gerais, quais permanecem confiáveis e onde aparecem as maiores diferenças.

Modelos exibidos

Média de Pontuação de Conhecimentos gerais

3.1

Melhor modelo

Gemini 3.5 Flash 10.0

Motivos de falha

Com motivo de falha Resposta incorreta133 Com motivo de falha Erro de API13 Com motivo de falha Sem resposta8

169/169

Posição	Modelo	Empresa	Pontuação de Conhecimentos gerais	Pontuação	Custo total	Testes corretos	Tempo de resposta (médio)
#144	Ring-2.6-1T none	Inclusionai	3.0	4.8	$0.026	0/1	133.6s
Total de testes 1 Testes errados 1 Custo total $0.026 Tempo de resposta (médio) 133.6s
#145	GPT-5.4 Nano none	OpenAI	3.0	4.8	$0.011	0/1	773ms
Total de testes 1 Testes errados 1 Custo total $0.011 Tempo de resposta (médio) 773ms
#146	MiniMax M2.5 medium	Minimax	3.0	4.7	$0.303	0/1	80.8s
Total de testes 1 Testes errados 1 Custo total $0.303 Tempo de resposta (médio) 80.8s
#147	Ling-2.6-1T none	Inclusionai	3.0	4.7	$0.005	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.005 Tempo de resposta (médio) 0ms
#148	Qwen3 Coder Next medium	Qwen	3.0	4.7	$0.008	0/1	399ms
Total de testes 1 Testes errados 1 Custo total $0.008 Tempo de resposta (médio) 399ms
#150	Laguna M.1 none	Poolside	3.0	4.6	$0.000	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 0ms
#151	Mercury 2 none	Inception	3.0	4.6	$0.011	0/1	548ms
Total de testes 1 Testes errados 1 Custo total $0.011 Tempo de resposta (médio) 548ms
#152	Elephant Alpha none	Openrouter	3.0	4.6	$0.000	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 0ms
#153	Elephant Alpha medium	Openrouter	3.0	4.5	$0.000	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 0ms
#156	Laguna Xs.2 medium	Poolside	3.0	4.3	$0.000	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 0ms
#157	GLM 4.7 Flash medium	Z.ai	3.0	4.3	$0.054	0/1	11.1s
Total de testes 1 Testes errados 1 Custo total $0.054 Tempo de resposta (médio) 11.1s
#158	Hy3 preview none	Tencent	3.0	4.3	$0.003	0/1	2.71s
Total de testes 1 Testes errados 1 Custo total $0.003 Tempo de resposta (médio) 2.71s
#159	MiMo-V2-Flash none	Xiaomi	3.0	4.3	$0.025	0/1	1.82s
Total de testes 1 Testes errados 1 Custo total $0.025 Tempo de resposta (médio) 1.82s
#160	Grok Build 0.1 none	X AI	3.0	4.2	$0.547	0/1	36.1s
Total de testes 1 Testes errados 1 Custo total $0.547 Tempo de resposta (médio) 36.1s
#161	Grok 4.1 Fast none	X AI	3.0	4.0	$0.008	0/1	731ms
Total de testes 1 Testes errados 1 Custo total $0.008 Tempo de resposta (médio) 731ms

←

1 9 10 11 12

→

Ranking de Conhecimentos gerais

Filtrar modelos

Melhores modelos por Pontuação de Conhecimentos gerais

Pontuação de Conhecimentos gerais vs custo total

Melhores modelos por Tempo de resposta (médio)