Ranking de modelos de Conhecimentos gerais

Categoria AI BENCHY

Veja quais modelos de IA vão melhor em Conhecimentos gerais, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Custo total ↓.

Modelos exibidos

Média de Pontuação de Conhecimentos gerais

3.1

Melhor modelo

Grok 4.20 Multi Agent Beta 0.0

Motivos de falha

Com motivo de falha Resposta incorreta133 Com motivo de falha Erro de API13 Com motivo de falha Sem resposta8

169/169

Posição	Modelo	Empresa	Pontuação de Conhecimentos gerais	Pontuação	Custo total	Testes corretos	Tempo de resposta (médio)
#148	Qwen3 Coder Next medium	Qwen	3.0	4.7	$0.008	0/1	399ms
Total de testes 1 Testes errados 1 Custo total $0.008 Tempo de resposta (médio) 399ms
#137	Trinity Large Preview none	Arcee AI	3.0	5.0	$0.008	0/1	777ms
Total de testes 1 Testes errados 1 Custo total $0.008 Tempo de resposta (médio) 777ms
#161	Grok 4.1 Fast none	X AI	3.0	4.0	$0.008	0/1	731ms
Total de testes 1 Testes errados 1 Custo total $0.008 Tempo de resposta (médio) 731ms
#117	DeepSeek V4 Flash none	DeepSeek	3.0	5.5	$0.007	0/1	3.07s
Total de testes 1 Testes errados 1 Custo total $0.007 Tempo de resposta (médio) 3.07s
#129	Mistral Small 4 none	Mistral	3.0	5.1	$0.007	0/1	397ms
Total de testes 1 Testes errados 1 Custo total $0.007 Tempo de resposta (médio) 397ms
#134	MiMo-V2.5 none	Xiaomi	3.0	5.1	$0.007	0/1	3.89s
Total de testes 1 Testes errados 1 Custo total $0.007 Tempo de resposta (médio) 3.89s
#142	Nemotron 3 Super none	NVIDIA	3.0	4.9	$0.007	0/1	8.94s
Total de testes 1 Testes errados 1 Custo total $0.007 Tempo de resposta (médio) 8.94s
#139	GPT-4o-mini none	OpenAI	3.0	5.0	$0.006	0/1	794ms
Total de testes 1 Testes errados 1 Custo total $0.006 Tempo de resposta (médio) 794ms
#135	Qwen3.5-9B none	Qwen	3.0	5.1	$0.006	0/1	2.32s
Total de testes 1 Testes errados 1 Custo total $0.006 Tempo de resposta (médio) 2.32s
#147	Ling-2.6-1T none	Inclusionai	3.0	4.7	$0.005	0/1	0ms
Total de testes 1 Testes errados 1 Custo total $0.005 Tempo de resposta (médio) 0ms
#97	Qwen3.5-Flash none	Qwen	3.0	6.1	$0.005	0/1	588ms
Total de testes 1 Testes errados 1 Custo total $0.005 Tempo de resposta (médio) 588ms
#141	GLM 4.7 Flash none	Z.ai	3.0	4.9	$0.004	0/1	692ms
Total de testes 1 Testes errados 1 Custo total $0.004 Tempo de resposta (médio) 692ms
#121	Gemma 4 26B A4B none	Google	3.0	5.5	$0.004	0/1	778ms
Total de testes 1 Testes errados 1 Custo total $0.004 Tempo de resposta (médio) 778ms
#98	Gemma 4 31B none	Google	3.0	6.1	$0.004	0/1	1.25s
Total de testes 1 Testes errados 1 Custo total $0.004 Tempo de resposta (médio) 1.25s
#163	Granite 4.1 8B none	IBM Granite	3.0	4.0	$0.003	0/1	306ms
Total de testes 1 Testes errados 1 Custo total $0.003 Tempo de resposta (médio) 306ms

←

1 9 10 11 12

→

Ranking de Conhecimentos gerais

Filtrar modelos

Melhores modelos por Pontuação de Conhecimentos gerais

Pontuação de Conhecimentos gerais vs custo total

Melhores modelos por Tempo de resposta (médio)