Ranking de modelos de Conhecimentos gerais

Categoria AI BENCHY

Veja quais modelos de IA vão melhor em Conhecimentos gerais, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Testes corretos ↓.

Modelos exibidos

Média de Pontuação de Conhecimentos gerais

3.1

Melhor modelo

Gemini 3.5 Flash 10.0

Motivos de falha

Com motivo de falha Resposta incorreta133 Com motivo de falha Erro de API13 Com motivo de falha Sem resposta8

169/169

Posição	Modelo	Empresa	Pontuação de Conhecimentos gerais	Pontuação	Custo total	Testes corretos	Tempo de resposta (médio)
#45	GPT-5.3 Chat none	OpenAI	3.0	7.5	$0.433	0/1	4.38s
Total de testes 1 Testes errados 1 Custo total $0.433 Tempo de resposta (médio) 4.38s
#46	GPT-5.4 Nano medium	OpenAI	3.0	7.5	$0.107	0/1	4.81s
Total de testes 1 Testes errados 1 Custo total $0.107 Tempo de resposta (médio) 4.81s
#47	Qwen3.6 Flash medium	Qwen	3.0	7.5	$0.288	0/1	122.9s
Total de testes 1 Testes errados 1 Custo total $0.288 Tempo de resposta (médio) 122.9s
#48	DeepSeek V3.2 medium	DeepSeek	3.0	7.5	$0.044	0/1	84.0s
Total de testes 1 Testes errados 1 Custo total $0.044 Tempo de resposta (médio) 84.0s
#49	Claude Opus 4.7 none	Anthropic	3.0	7.4	$0.505	0/1	1.46s
Total de testes 1 Testes errados 1 Custo total $0.505 Tempo de resposta (médio) 1.46s
#50	Seed-2.0-Mini medium	Bytedance Seed	3.0	7.4	$0.044	0/1	56.8s
Total de testes 1 Testes errados 1 Custo total $0.044 Tempo de resposta (médio) 56.8s
#51	MiMo-V2.5-Pro medium	Xiaomi	3.0	7.4	$0.106	0/1	12.5s
Total de testes 1 Testes errados 1 Custo total $0.106 Tempo de resposta (médio) 12.5s
#53	Grok 4.20 medium	X AI	3.0	7.3	$0.609	0/1	63.5s
Total de testes 1 Testes errados 1 Custo total $0.609 Tempo de resposta (médio) 63.5s
#54	Hy3 preview medium	Tencent	3.0	7.3	$0.021	0/1	39.9s
Total de testes 1 Testes errados 1 Custo total $0.021 Tempo de resposta (médio) 39.9s
#55	Claude Sonnet 4.6 none	Anthropic	3.0	7.3	$0.316	0/1	4.67s
Total de testes 1 Testes errados 1 Custo total $0.316 Tempo de resposta (médio) 4.67s
#56	GLM 5V Turbo medium	Z.ai	3.0	7.3	$0.457	0/1	41.0s
Total de testes 1 Testes errados 1 Custo total $0.457 Tempo de resposta (médio) 41.0s
#57	Claude Opus 4.8 none	Anthropic	3.0	7.2	$0.539	0/1	3.41s
Total de testes 1 Testes errados 1 Custo total $0.539 Tempo de resposta (médio) 3.41s
#58	DeepSeek V4 Pro none	DeepSeek	3.0	7.2	$0.034	0/1	5.76s
Total de testes 1 Testes errados 1 Custo total $0.034 Tempo de resposta (médio) 5.76s
#59	Gemma 4 26B A4B medium	Google	3.0	7.2	$0.045	0/1	180.9s
Total de testes 1 Testes errados 1 Custo total $0.045 Tempo de resposta (médio) 180.9s
#60	Qwen3.7 Plus none	Qwen	3.0	7.2	$0.023	0/1	1.21s
Total de testes 1 Testes errados 1 Custo total $0.023 Tempo de resposta (médio) 1.21s

Ranking de Conhecimentos gerais

Filtrar modelos

Melhores modelos por Pontuação de Conhecimentos gerais

Pontuação de Conhecimentos gerais vs custo total

Melhores modelos por Tempo de resposta (médio)