Ranking de modelos de Inteligência geral

Veja quais modelos de IA vão melhor em Inteligência geral, quais permanecem confiáveis e onde aparecem as maiores diferenças. Ordenar por: Testes corretos ↓.

Modelos exibidos

Média de Pontuação de Inteligência geral

6.1

Melhor modelo

Gemini 3 Flash Preview 10.0

Motivos de falha

Com motivo de falha Não seguiu as instruções78 Com motivo de falha Resposta incorreta59 Com motivo de falha Erro de API12 Com motivo de falha Tempo esgotado4

210/210

Posição	Modelo	Empresa	Pontuação de Inteligência geral	Pontuação	Custo total	Testes corretos	Tempo de resposta (médio)
#61	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.177	1/1	3.68s
Total de testes 1 Testes errados 0 Custo total $0.177 Tempo de resposta (médio) 3.68s
#64	Gemini 3.1 Flash Lite Preview medium	Google	10.0	7.3	$0.115	1/1	3.16s
Total de testes 1 Testes errados 0 Custo total $0.115 Tempo de resposta (médio) 3.16s
#65	Gemini 3.1 Flash Lite medium	Google	10.0	7.3	$0.117	1/1	2.60s
Total de testes 1 Testes errados 0 Custo total $0.117 Tempo de resposta (médio) 2.60s
#66	Claude Opus 4.8 none	Anthropic	10.0	7.3	$1.166	1/1	3.48s
Total de testes 1 Testes errados 0 Custo total $1.166 Tempo de resposta (médio) 3.48s
#68	Kimi K2.6 medium	Moonshot AI	10.0	7.2	$1.036	1/1	17.8s
Total de testes 1 Testes errados 0 Custo total $1.036 Tempo de resposta (médio) 17.8s
#74	GLM 5.1 medium	Z.ai	10.0	7.1	$0.535	1/1	20.9s
Total de testes 1 Testes errados 0 Custo total $0.535 Tempo de resposta (médio) 20.9s
#79	Gemini 3.5 Flash none	Google	10.0	7.0	$1.079	1/1	3.46s
Total de testes 1 Testes errados 0 Custo total $1.079 Tempo de resposta (médio) 3.46s
#87	GPT-5.5 none	OpenAI	10.0	6.9	$0.544	1/1	3.41s
Total de testes 1 Testes errados 0 Custo total $0.544 Tempo de resposta (médio) 3.41s
#88	Gemini 3.5 Flash minimal	Google	10.0	6.8	$0.300	1/1	922ms
Total de testes 1 Testes errados 0 Custo total $0.300 Tempo de resposta (médio) 922ms
#89	Gemini 3 Flash Preview none	Google	10.0	6.8	$0.085	1/1	1.13s
Total de testes 1 Testes errados 0 Custo total $0.085 Tempo de resposta (médio) 1.13s
#93	GLM 5V Turbo medium	Z.ai	10.0	6.7	$0.457	1/1	11.1s
Total de testes 1 Testes errados 0 Custo total $0.457 Tempo de resposta (médio) 11.1s
#94	Claude Opus 4.7 none	Anthropic	10.0	6.6	$0.505	1/1	3.47s
Total de testes 1 Testes errados 0 Custo total $0.505 Tempo de resposta (médio) 3.47s
#95	Gemma 4 26B A4B medium	Google	10.0	6.6	$0.089	1/1	29.8s
Total de testes 1 Testes errados 0 Custo total $0.089 Tempo de resposta (médio) 29.8s
#100	Hy3 preview medium	Tencent	10.0	6.5	$0.018	1/1	16.8s
Total de testes 1 Testes errados 0 Custo total $0.018 Tempo de resposta (médio) 16.8s
#109	Mimo V2 PRO medium	Xiaomi	10.0	6.3	$0.333	1/1	4.92s
Total de testes 1 Testes errados 0 Custo total $0.333 Tempo de resposta (médio) 4.92s

Ranking de Inteligência geral

Filtrar modelos

Melhores modelos por Pontuação de Inteligência geral

Pontuação de Inteligência geral vs custo total

Melhores modelos por Tempo de resposta (médio)