Ranking de modelos de Conhecimentos gerais

Categoria AI BENCHY

Veja quais modelos de IA vão melhor em Conhecimentos gerais, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Métrica ↑.

Modelos exibidos

Média de Pontuação de Conhecimentos gerais

3.1

Melhor modelo

Grok 4.20 Beta 0.0

Motivos de falha

Com motivo de falha Resposta incorreta133 Com motivo de falha Erro de API13 Com motivo de falha Sem resposta8

169/169

Posição	Modelo	Empresa	Pontuação de Conhecimentos gerais	Pontuação	Custo total	Testes corretos	Tempo de resposta (médio)
#41	DeepSeek V4 Pro high	DeepSeek	3.0	7.6	$0.157	0/1	34.0s
Total de testes 1 Testes errados 1 Custo total $0.157 Tempo de resposta (médio) 34.0s
#42	Grok Build 0.1 medium	X AI	3.0	7.6	$0.927	0/1	53.5s
Total de testes 1 Testes errados 1 Custo total $0.927 Tempo de resposta (médio) 53.5s
#43	Kimi K2.5 medium	Moonshot AI	3.0	7.5	$0.348	0/1	83.9s
Total de testes 1 Testes errados 1 Custo total $0.348 Tempo de resposta (médio) 83.9s
#44	Mercury 2 medium	Inception	3.0	7.5	$0.058	0/1	2.58s
Total de testes 1 Testes errados 1 Custo total $0.058 Tempo de resposta (médio) 2.58s
#45	GPT-5.3 Chat none	OpenAI	3.0	7.5	$0.433	0/1	4.38s
Total de testes 1 Testes errados 1 Custo total $0.433 Tempo de resposta (médio) 4.38s
#46	GPT-5.4 Nano medium	OpenAI	3.0	7.5	$0.107	0/1	4.81s
Total de testes 1 Testes errados 1 Custo total $0.107 Tempo de resposta (médio) 4.81s
#47	Qwen3.6 Flash medium	Qwen	3.0	7.5	$0.288	0/1	122.9s
Total de testes 1 Testes errados 1 Custo total $0.288 Tempo de resposta (médio) 122.9s
#48	DeepSeek V3.2 medium	DeepSeek	3.0	7.5	$0.044	0/1	84.0s
Total de testes 1 Testes errados 1 Custo total $0.044 Tempo de resposta (médio) 84.0s
#49	Claude Opus 4.7 none	Anthropic	3.0	7.4	$0.505	0/1	1.46s
Total de testes 1 Testes errados 1 Custo total $0.505 Tempo de resposta (médio) 1.46s
#50	Seed-2.0-Mini medium	Bytedance Seed	3.0	7.4	$0.044	0/1	56.8s
Total de testes 1 Testes errados 1 Custo total $0.044 Tempo de resposta (médio) 56.8s
#51	MiMo-V2.5-Pro medium	Xiaomi	3.0	7.4	$0.106	0/1	12.5s
Total de testes 1 Testes errados 1 Custo total $0.106 Tempo de resposta (médio) 12.5s
#53	Grok 4.20 medium	X AI	3.0	7.3	$0.609	0/1	63.5s
Total de testes 1 Testes errados 1 Custo total $0.609 Tempo de resposta (médio) 63.5s
#54	Hy3 preview medium	Tencent	3.0	7.3	$0.021	0/1	39.9s
Total de testes 1 Testes errados 1 Custo total $0.021 Tempo de resposta (médio) 39.9s
#55	Claude Sonnet 4.6 none	Anthropic	3.0	7.3	$0.316	0/1	4.67s
Total de testes 1 Testes errados 1 Custo total $0.316 Tempo de resposta (médio) 4.67s
#56	GLM 5V Turbo medium	Z.ai	3.0	7.3	$0.457	0/1	41.0s
Total de testes 1 Testes errados 1 Custo total $0.457 Tempo de resposta (médio) 41.0s

Ranking de Conhecimentos gerais

Filtrar modelos

Melhores modelos por Pontuação de Conhecimentos gerais

Pontuação de Conhecimentos gerais vs custo total

Melhores modelos por Tempo de resposta (médio)