Ranking de modelos de Inteligência geral

Veja quais modelos de IA vão melhor em Inteligência geral, quais permanecem confiáveis e onde aparecem as maiores diferenças.

Modelos exibidos

Média de Pontuação de Inteligência geral

6.1

Melhor modelo

Gemini 3 Flash Preview 10.0

Motivos de falha

Com motivo de falha Não seguiu as instruções78 Com motivo de falha Resposta incorreta59 Com motivo de falha Erro de API12 Com motivo de falha Tempo esgotado4

210/210

Posição	Modelo	Empresa	Pontuação de Inteligência geral	Pontuação	Custo total	Testes corretos	Tempo de resposta (médio)
#110	Gemma 4 31B medium	Google	10.0	6.3	$0.163	1/1	9.57s
Total de testes 1 Testes errados 0 Custo total $0.163 Tempo de resposta (médio) 9.57s
#115	Gemma 4 31B none	Google	10.0	6.2	$0.035	1/1	2.09s
Total de testes 1 Testes errados 0 Custo total $0.035 Tempo de resposta (médio) 2.09s
#116	Seed-2.0-Lite none	Bytedance Seed	10.0	6.2	$0.066	1/1	3.45s
Total de testes 1 Testes errados 0 Custo total $0.066 Tempo de resposta (médio) 3.45s
#123	Inkling low	Thinkingmachines	10.0	6.1	$0.187	1/1	3.44s
Total de testes 1 Testes errados 0 Custo total $0.187 Tempo de resposta (médio) 3.44s
#124	Qwen3.6 Flash none	Qwen	10.0	6.1	$0.062	1/1	947ms
Total de testes 1 Testes errados 0 Custo total $0.062 Tempo de resposta (médio) 947ms
#125	Qwen3.5-Flash none	Qwen	10.0	6.1	$0.073	1/1	803ms
Total de testes 1 Testes errados 0 Custo total $0.073 Tempo de resposta (médio) 803ms
#131	Grok 4.20 Beta medium	X AI	10.0	6.0	$0.750	1/1	5.78s
Total de testes 1 Testes errados 0 Custo total $0.750 Tempo de resposta (médio) 5.78s
#133	Gemini 3 PRO Preview medium	Google	10.0	6.0	$0.385	1/1	9.34s
Total de testes 1 Testes errados 0 Custo total $0.385 Tempo de resposta (médio) 9.34s
#141	GLM 5 none	Z.ai	10.0	5.7	$0.041	1/1	3.27s
Total de testes 1 Testes errados 0 Custo total $0.041 Tempo de resposta (médio) 3.27s
#155	Kimi K2.5 none	Moonshot AI	10.0	5.5	$0.127	1/1	4.00s
Total de testes 1 Testes errados 0 Custo total $0.127 Tempo de resposta (médio) 4.00s
#163	Gemini 3.1 Flash Lite Preview high	Google	10.0	5.3	$2.310	1/1	5.25s
Total de testes 1 Testes errados 0 Custo total $2.310 Tempo de resposta (médio) 5.25s
#166	Qwen3 Coder Next none	Qwen	10.0	5.1	$0.025	1/1	1.34s
Total de testes 1 Testes errados 0 Custo total $0.025 Tempo de resposta (médio) 1.34s
#184	Hunter Alpha medium	OpenRouter	7.0	4.7	$0.000	0/1	6.44s
Total de testes 1 Testes errados 1 Custo total $0.000 Tempo de resposta (médio) 6.44s
#35	Seed-2.0-Lite medium	Bytedance Seed	6.7	7.9	$0.234	0/1	18.2s
Total de testes 1 Testes errados 1 Custo total $0.234 Tempo de resposta (médio) 18.2s
#22	Grok 4.5 medium	X AI	6.5	8.3	$1.928	0/1	12.8s
Total de testes 1 Testes errados 1 Custo total $1.928 Tempo de resposta (médio) 12.8s

Ranking de Inteligência geral

Filtrar modelos

Melhores modelos por Pontuação de Inteligência geral

Pontuação de Inteligência geral vs custo total

Melhores modelos por Tempo de resposta (médio)