Ranking de modelos de Conhecimentos gerais

Categoria AI BENCHY

Veja quais modelos de IA vão melhor em Conhecimentos gerais, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Testes corretos ↑.

Modelos exibidos

Média de Pontuação de Conhecimentos gerais

3.1

Melhor modelo

Qwen3.7 Max 3.0

Motivos de falha

Com motivo de falha Resposta incorreta133 Com motivo de falha Erro de API13 Com motivo de falha Sem resposta8

169/169

Posição	Modelo	Empresa	Pontuação de Conhecimentos gerais	Pontuação	Custo total	Testes corretos	Tempo de resposta (médio)
#36	Qwen3.5-122B-A10B medium	Qwen	3.0	7.7	$0.588	0/1	52.9s
Total de testes 1 Testes errados 1 Custo total $0.588 Tempo de resposta (médio) 52.9s
#37	Grok 4.3 medium	X AI	3.0	7.7	$0.614	0/1	44.5s
Total de testes 1 Testes errados 1 Custo total $0.614 Tempo de resposta (médio) 44.5s
#38	Claude Opus 4.6 medium	Anthropic	3.0	7.7	$2.053	0/1	63.2s
Total de testes 1 Testes errados 1 Custo total $2.053 Tempo de resposta (médio) 63.2s
#39	Step 3.7 Flash low	Stepfun	3.0	7.7	$0.341	0/1	124.8s
Total de testes 1 Testes errados 1 Custo total $0.341 Tempo de resposta (médio) 124.8s
#40	MiniMax M3 medium	Minimax	3.0	7.6	$0.131	0/1	100.8s
Total de testes 1 Testes errados 1 Custo total $0.131 Tempo de resposta (médio) 100.8s
#41	DeepSeek V4 Pro high	DeepSeek	3.0	7.6	$0.157	0/1	34.0s
Total de testes 1 Testes errados 1 Custo total $0.157 Tempo de resposta (médio) 34.0s
#42	Grok Build 0.1 medium	X AI	3.0	7.6	$0.927	0/1	53.5s
Total de testes 1 Testes errados 1 Custo total $0.927 Tempo de resposta (médio) 53.5s
#43	Kimi K2.5 medium	Moonshot AI	3.0	7.5	$0.348	0/1	83.9s
Total de testes 1 Testes errados 1 Custo total $0.348 Tempo de resposta (médio) 83.9s
#44	Mercury 2 medium	Inception	3.0	7.5	$0.058	0/1	2.58s
Total de testes 1 Testes errados 1 Custo total $0.058 Tempo de resposta (médio) 2.58s
#45	GPT-5.3 Chat none	OpenAI	3.0	7.5	$0.433	0/1	4.38s
Total de testes 1 Testes errados 1 Custo total $0.433 Tempo de resposta (médio) 4.38s
#46	GPT-5.4 Nano medium	OpenAI	3.0	7.5	$0.107	0/1	4.81s
Total de testes 1 Testes errados 1 Custo total $0.107 Tempo de resposta (médio) 4.81s
#47	Qwen3.6 Flash medium	Qwen	3.0	7.5	$0.288	0/1	122.9s
Total de testes 1 Testes errados 1 Custo total $0.288 Tempo de resposta (médio) 122.9s
#48	DeepSeek V3.2 medium	DeepSeek	3.0	7.5	$0.044	0/1	84.0s
Total de testes 1 Testes errados 1 Custo total $0.044 Tempo de resposta (médio) 84.0s
#49	Claude Opus 4.7 none	Anthropic	3.0	7.4	$0.505	0/1	1.46s
Total de testes 1 Testes errados 1 Custo total $0.505 Tempo de resposta (médio) 1.46s
#50	Seed-2.0-Mini medium	Bytedance Seed	3.0	7.4	$0.044	0/1	56.8s
Total de testes 1 Testes errados 1 Custo total $0.044 Tempo de resposta (médio) 56.8s

Ranking de Conhecimentos gerais

Filtrar modelos

Melhores modelos por Pontuação de Conhecimentos gerais

Pontuação de Conhecimentos gerais vs custo total

Melhores modelos por Tempo de resposta (médio)