Ranking de modelos de Conhecimentos gerais

Categoria AI BENCHY

Veja quais modelos de IA vão melhor em Conhecimentos gerais, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Tempo de resposta (médio) ↑.

Modelos exibidos

Média de Pontuação de Conhecimentos gerais

3.1

Melhor modelo

Grok 4.20 Beta 0.0

Motivos de falha

Com motivo de falha Resposta incorreta133 Com motivo de falha Erro de API13 Com motivo de falha Sem resposta8

169/169

Posição	Modelo	Empresa	Pontuação de Conhecimentos gerais	Pontuação	Custo total	Testes corretos	Tempo de resposta (médio)
#127	MiniMax M2.7 medium	Minimax	3.0	5.2	$0.104	0/1	22.8s
Total de testes 1 Testes errados 1 Custo total $0.104 Tempo de resposta (médio) 22.8s
#115	Grok 4.1 Fast medium	X AI	3.0	5.6	$0.069	0/1	25.5s
Total de testes 1 Testes errados 1 Custo total $0.069 Tempo de resposta (médio) 25.5s
#6	Claude Fable 5 medium	Anthropic	3.0	9.2	$3.165	0/1	25.6s
Total de testes 1 Testes errados 1 Custo total $3.165 Tempo de resposta (médio) 25.6s
#78	gpt-oss-120b medium	OpenAI	3.0	6.7	$0.013	0/1	26.5s
Total de testes 1 Testes errados 1 Custo total $0.013 Tempo de resposta (médio) 26.5s
#22	GPT-5.2 medium	OpenAI	3.0	8.4	$0.548	0/1	28.2s
Total de testes 1 Testes errados 1 Custo total $0.548 Tempo de resposta (médio) 28.2s
#64	GLM 5.1 medium	Z.ai	3.0	7.1	$0.292	0/1	29.4s
Total de testes 1 Testes errados 1 Custo total $0.292 Tempo de resposta (médio) 29.4s
#31	Claude Sonnet 4.6 medium	Anthropic	3.0	7.8	$1.418	0/1	30.1s
Total de testes 1 Testes errados 1 Custo total $1.418 Tempo de resposta (médio) 30.1s
#27	GPT-5.4 Mini medium	OpenAI	3.0	8.0	$0.526	0/1	30.1s
Total de testes 1 Testes errados 1 Custo total $0.526 Tempo de resposta (médio) 30.1s
#75	Qwen3.6 35B A3B medium	Qwen	3.0	6.7	$0.146	0/1	32.9s
Total de testes 1 Testes errados 1 Custo total $0.146 Tempo de resposta (médio) 32.9s
#122	Qwen3.5 Plus 2026-04-20 none	Qwen	3.0	5.5	$0.032	0/1	33.3s
Total de testes 1 Testes errados 1 Custo total $0.032 Tempo de resposta (médio) 33.3s
#3	Qwen3.7 Max medium	Qwen	3.0	9.4	$0.523	0/1	33.4s
Total de testes 1 Testes errados 1 Custo total $0.523 Tempo de resposta (médio) 33.4s
#41	DeepSeek V4 Pro high	DeepSeek	3.0	7.6	$0.157	0/1	34.0s
Total de testes 1 Testes errados 1 Custo total $0.157 Tempo de resposta (médio) 34.0s
#14	GLM 5.2 medium	Z.ai	3.0	8.7	$0.324	0/1	34.2s
Total de testes 1 Testes errados 1 Custo total $0.324 Tempo de resposta (médio) 34.2s
#160	Grok Build 0.1 none	X AI	3.0	4.2	$0.547	0/1	36.1s
Total de testes 1 Testes errados 1 Custo total $0.547 Tempo de resposta (médio) 36.1s
#140	Cobuddy medium	Baidu	3.0	4.9	$0.000	0/1	37.0s
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 37.0s

Ranking de Conhecimentos gerais

Filtrar modelos

Melhores modelos por Pontuação de Conhecimentos gerais

Pontuação de Conhecimentos gerais vs custo total

Melhores modelos por Tempo de resposta (médio)