Ranking de modelos de Conhecimentos gerais

Categoria AI BENCHY

Veja quais modelos de IA vão melhor em Conhecimentos gerais, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Tempo de resposta (médio) ↑.

Modelos exibidos

Média de Pontuação de Conhecimentos gerais

3.1

Melhor modelo

Grok 4.20 Beta 0.0

Motivos de falha

Com motivo de falha Resposta incorreta133 Com motivo de falha Erro de API13 Com motivo de falha Sem resposta8

169/169

Posição	Modelo	Empresa	Pontuação de Conhecimentos gerais	Pontuação	Custo total	Testes corretos	Tempo de resposta (médio)
#62	MiMo-V2-Flash medium	Xiaomi	3.0	7.1	$0.043	0/1	1.96s
Total de testes 1 Testes errados 1 Custo total $0.043 Tempo de resposta (médio) 1.96s
#92	Seed-2.0-Lite none	Bytedance Seed	3.0	6.2	$0.019	0/1	1.96s
Total de testes 1 Testes errados 1 Custo total $0.019 Tempo de resposta (médio) 1.96s
#100	Qwen3.6 Max Preview none	Qwen	3.0	6.0	$0.075	0/1	1.97s
Total de testes 1 Testes errados 1 Custo total $0.075 Tempo de resposta (médio) 1.97s
#105	GLM 5V Turbo none	Z.ai	3.0	5.9	$0.052	0/1	2.23s
Total de testes 1 Testes errados 1 Custo total $0.052 Tempo de resposta (médio) 2.23s
#13	Claude Opus 4.7 medium	Anthropic	3.0	8.7	$0.679	0/1	2.25s
Total de testes 1 Testes errados 1 Custo total $0.679 Tempo de resposta (médio) 2.25s
#135	Qwen3.5-9B none	Qwen	3.0	5.1	$0.006	0/1	2.32s
Total de testes 1 Testes errados 1 Custo total $0.006 Tempo de resposta (médio) 2.32s
#116	GLM 5.1 none	Z.ai	3.0	5.6	$0.058	0/1	2.34s
Total de testes 1 Testes errados 1 Custo total $0.058 Tempo de resposta (médio) 2.34s
#123	GLM 5 Turbo none	Z.ai	3.0	5.3	$0.047	0/1	2.37s
Total de testes 1 Testes errados 1 Custo total $0.047 Tempo de resposta (médio) 2.37s
#108	Owl Alpha medium	Openrouter	3.0	5.8	$0.000	0/1	2.38s
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 2.38s
#110	Owl Alpha none	Openrouter	3.0	5.8	$0.000	0/1	2.50s
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 2.50s
#44	Mercury 2 medium	Inception	3.0	7.5	$0.058	0/1	2.58s
Total de testes 1 Testes errados 1 Custo total $0.058 Tempo de resposta (médio) 2.58s
#32	Gemini 3.1 Flash Lite Preview medium	Google	3.0	7.8	$0.068	0/1	2.68s
Total de testes 1 Testes errados 1 Custo total $0.068 Tempo de resposta (médio) 2.68s
#158	Hy3 preview none	Tencent	3.0	4.3	$0.003	0/1	2.71s
Total de testes 1 Testes errados 1 Custo total $0.003 Tempo de resposta (médio) 2.71s
#52	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.111	1/1	2.75s
Total de testes 1 Testes errados 0 Custo total $0.111 Tempo de resposta (médio) 2.75s
#8	Gemini 3.5 Flash medium	Google	10.0	9.1	$0.582	1/1	2.75s
Total de testes 1 Testes errados 0 Custo total $0.582 Tempo de resposta (médio) 2.75s

Ranking de Conhecimentos gerais

Filtrar modelos

Melhores modelos por Pontuação de Conhecimentos gerais

Pontuação de Conhecimentos gerais vs custo total

Melhores modelos por Tempo de resposta (médio)