Ranking de modelos de Conhecimentos gerais

Categoria AI BENCHY

Veja quais modelos de IA vão melhor em Conhecimentos gerais, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Testes corretos ↓.

Modelos exibidos

Média de Pontuação de Conhecimentos gerais

3.1

Melhor modelo

Gemini 3.5 Flash 10.0

Motivos de falha

Com motivo de falha Resposta incorreta133 Com motivo de falha Erro de API13 Com motivo de falha Sem resposta8

169/169

Posição	Modelo	Empresa	Pontuação de Conhecimentos gerais	Pontuação	Custo total	Testes corretos	Tempo de resposta (médio)
#61	GLM 5.2 none	Z.ai	3.0	7.1	$0.076	0/1	3.41s
Total de testes 1 Testes errados 1 Custo total $0.076 Tempo de resposta (médio) 3.41s
#62	MiMo-V2-Flash medium	Xiaomi	3.0	7.1	$0.043	0/1	1.96s
Total de testes 1 Testes errados 1 Custo total $0.043 Tempo de resposta (médio) 1.96s
#63	Step 3.7 Flash high	Stepfun	3.0	7.1	$1.148	0/1	149.3s
Total de testes 1 Testes errados 1 Custo total $1.148 Tempo de resposta (médio) 149.3s
#64	GLM 5.1 medium	Z.ai	3.0	7.1	$0.292	0/1	29.4s
Total de testes 1 Testes errados 1 Custo total $0.292 Tempo de resposta (médio) 29.4s
#65	Kimi K2.7 Code medium	Moonshot AI	3.0	7.0	$0.583	0/1	341.8s
Total de testes 1 Testes errados 1 Custo total $0.583 Tempo de resposta (médio) 341.8s
#66	Gemini 3.5 Flash none	Google	2.8	7.0	$1.079	0/1	4.87s
Total de testes 1 Testes errados 1 Custo total $1.079 Tempo de resposta (médio) 4.87s
#67	Gemini 3 Flash Preview none	Google	3.0	6.9	$0.025	0/1	1.07s
Total de testes 1 Testes errados 1 Custo total $0.025 Tempo de resposta (médio) 1.07s
#68	Qwen3.7 Max none	Qwen	3.0	6.9	$0.054	0/1	856ms
Total de testes 1 Testes errados 1 Custo total $0.054 Tempo de resposta (médio) 856ms
#69	Grok 4.20 Beta medium	X AI	0.0	6.8	$0.750	0/0	0ms
Total de testes 0 Testes errados 0 Custo total $0.750 Tempo de resposta (médio) 0ms
#70	Qwen3.5-Flash medium	Qwen	3.0	6.8	$0.080	0/1	49.0s
Total de testes 1 Testes errados 1 Custo total $0.080 Tempo de resposta (médio) 49.0s
#71	Gemini 3.5 Flash minimal	Google	3.0	6.8	$0.108	0/1	1.76s
Total de testes 1 Testes errados 1 Custo total $0.108 Tempo de resposta (médio) 1.76s
#72	Ring-2.6-1T medium	Inclusionai	3.0	6.8	$0.033	0/1	113.9s
Total de testes 1 Testes errados 1 Custo total $0.033 Tempo de resposta (médio) 113.9s
#73	Mimo V2 Omni medium	Xiaomi	3.0	6.8	$0.683	0/1	234.2s
Total de testes 1 Testes errados 1 Custo total $0.683 Tempo de resposta (médio) 234.2s
#74	Hy3 preview high	Tencent	3.0	6.8	$0.059	0/1	47.7s
Total de testes 1 Testes errados 1 Custo total $0.059 Tempo de resposta (médio) 47.7s
#75	Qwen3.6 35B A3B medium	Qwen	3.0	6.7	$0.146	0/1	32.9s
Total de testes 1 Testes errados 1 Custo total $0.146 Tempo de resposta (médio) 32.9s

Ranking de Conhecimentos gerais

Filtrar modelos

Melhores modelos por Pontuação de Conhecimentos gerais

Pontuação de Conhecimentos gerais vs custo total

Melhores modelos por Tempo de resposta (médio)