Ranking de modelos de Conhecimentos gerais

Categoria AI BENCHY

Veja quais modelos de IA vão melhor em Conhecimentos gerais, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Testes corretos ↓.

Modelos exibidos

Média de Pontuação de Conhecimentos gerais

3.1

Melhor modelo

Gemini 3.5 Flash 10.0

Motivos de falha

Com motivo de falha Resposta incorreta133 Com motivo de falha Erro de API13 Com motivo de falha Sem resposta8

169/169

Posição	Modelo	Empresa	Pontuação de Conhecimentos gerais	Pontuação	Custo total	Testes corretos	Tempo de resposta (médio)
#151	Mercury 2 none	Inception	3.0	4.6	$0.011	0/1	548ms
Total de testes 1 Testes errados 1 Custo total $0.011 Tempo de resposta (médio) 548ms
#152	Elephant Alpha none	Openrouter	3.0	4.6	$0.000	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 0ms
#153	Elephant Alpha medium	Openrouter	3.0	4.5	$0.000	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 0ms
#154	Hunter Alpha none	OpenRouter	0.0	4.5	$0.000	0/0	0ms
Total de testes 0 Testes errados 0 Custo total $0.000 Tempo de resposta (médio) 0ms
#155	Grok 4.20 none	X AI	0.0	4.4	$0.057	0/0	0ms
Total de testes 0 Testes errados 0 Custo total $0.057 Tempo de resposta (médio) 0ms
#156	Laguna Xs.2 medium	Poolside	3.0	4.3	$0.000	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 0ms
#157	GLM 4.7 Flash medium	Z.ai	3.0	4.3	$0.054	0/1	11.1s
Total de testes 1 Testes errados 1 Custo total $0.054 Tempo de resposta (médio) 11.1s
#158	Hy3 preview none	Tencent	3.0	4.3	$0.003	0/1	2.71s
Total de testes 1 Testes errados 1 Custo total $0.003 Tempo de resposta (médio) 2.71s
#159	MiMo-V2-Flash none	Xiaomi	3.0	4.3	$0.025	0/1	1.82s
Total de testes 1 Testes errados 1 Custo total $0.025 Tempo de resposta (médio) 1.82s
#160	Grok Build 0.1 none	X AI	3.0	4.2	$0.547	0/1	36.1s
Total de testes 1 Testes errados 1 Custo total $0.547 Tempo de resposta (médio) 36.1s
#161	Grok 4.1 Fast none	X AI	3.0	4.0	$0.008	0/1	731ms
Total de testes 1 Testes errados 1 Custo total $0.008 Tempo de resposta (médio) 731ms
#162	Laguna Xs.2 none	Poolside	3.0	4.0	$0.000	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 0ms
#163	Granite 4.1 8B none	IBM Granite	3.0	4.0	$0.003	0/1	306ms
Total de testes 1 Testes errados 1 Custo total $0.003 Tempo de resposta (médio) 306ms
#164	gpt-oss-120b none	OpenAI	3.0	4.0	$0.010	0/1	47.3s
Total de testes 1 Testes errados 1 Custo total $0.010 Tempo de resposta (médio) 47.3s
#165	Qwen3.5-9B medium	Qwen	3.0	3.8	$0.036	0/1	177.0s
Total de testes 1 Testes errados 1 Custo total $0.036 Tempo de resposta (médio) 177.0s

Ranking de Conhecimentos gerais

Filtrar modelos

Melhores modelos por Pontuação de Conhecimentos gerais

Pontuação de Conhecimentos gerais vs custo total

Melhores modelos por Tempo de resposta (médio)