Ranking de modelos de Conhecimentos gerais

Categoria AI BENCHY

Veja quais modelos de IA vão melhor em Conhecimentos gerais, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Métrica ↑.

Modelos exibidos

Média de Pontuação de Conhecimentos gerais

3.1

Melhor modelo

Grok 4.20 Beta 0.0

Motivos de falha

Com motivo de falha Resposta incorreta133 Com motivo de falha Erro de API13 Com motivo de falha Sem resposta8

169/169

Posição	Modelo	Empresa	Pontuação de Conhecimentos gerais	Pontuação	Custo total	Testes corretos	Tempo de resposta (médio)
#106	Qwen3.5 Plus 2026-02-15 none	Qwen	3.0	5.8	$0.016	0/1	1.11s
Total de testes 1 Testes errados 1 Custo total $0.016 Tempo de resposta (médio) 1.11s
#107	North Mini Code medium	Cohere	3.0	5.8	$0.000	0/1	305.0s
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 305.0s
#108	Owl Alpha medium	Openrouter	3.0	5.8	$0.000	0/1	2.38s
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 2.38s
#109	Mimo V2 PRO none	Xiaomi	3.0	5.8	$0.045	0/1	1.63s
Total de testes 1 Testes errados 1 Custo total $0.045 Tempo de resposta (médio) 1.63s
#110	Owl Alpha none	Openrouter	3.0	5.8	$0.000	0/1	2.50s
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 2.50s
#111	Kimi K2.6 none	Moonshot AI	3.0	5.8	$0.079	0/1	1.36s
Total de testes 1 Testes errados 1 Custo total $0.079 Tempo de resposta (médio) 1.36s
#112	GPT-5.4 none	OpenAI	3.0	5.8	$0.122	0/1	990ms
Total de testes 1 Testes errados 1 Custo total $0.122 Tempo de resposta (médio) 990ms
#113	Qwen3.6 Plus Preview medium	Qwen	3.0	5.8	$0.000	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 0ms
#114	Mimo V2 Omni none	Xiaomi	3.0	5.7	$0.021	0/1	1.30s
Total de testes 1 Testes errados 1 Custo total $0.021 Tempo de resposta (médio) 1.30s
#115	Grok 4.1 Fast medium	X AI	3.0	5.6	$0.069	0/1	25.5s
Total de testes 1 Testes errados 1 Custo total $0.069 Tempo de resposta (médio) 25.5s
#116	GLM 5.1 none	Z.ai	3.0	5.6	$0.058	0/1	2.34s
Total de testes 1 Testes errados 1 Custo total $0.058 Tempo de resposta (médio) 2.34s
#117	DeepSeek V4 Flash none	DeepSeek	3.0	5.5	$0.007	0/1	3.07s
Total de testes 1 Testes errados 1 Custo total $0.007 Tempo de resposta (médio) 3.07s
#118	Kimi K2.5 none	Moonshot AI	3.0	5.5	$0.027	0/1	3.90s
Total de testes 1 Testes errados 1 Custo total $0.027 Tempo de resposta (médio) 3.90s
#119	MiMo-V2.5-Pro none	Xiaomi	3.0	5.5	$0.017	0/1	1.89s
Total de testes 1 Testes errados 1 Custo total $0.017 Tempo de resposta (médio) 1.89s
#120	Qwen3.6 27B none	Qwen	3.0	5.5	$0.028	0/1	4.03s
Total de testes 1 Testes errados 1 Custo total $0.028 Tempo de resposta (médio) 4.03s

Ranking de Conhecimentos gerais

Filtrar modelos

Melhores modelos por Pontuação de Conhecimentos gerais

Pontuação de Conhecimentos gerais vs custo total

Melhores modelos por Tempo de resposta (médio)