Categoria AI BENCHY
Ranking de Conhecimentos gerais
Veja quais modelos de IA vão melhor em Conhecimentos gerais, quais permanecem confiáveis e onde aparecem as maiores diferenças.
Modelos exibidos
15
Média de Pontuação de Conhecimentos gerais
3.1
Melhor modelo
Gemini 3.5 Flash 10.0
169/169
Filtrar modelos
Nenhum modelo corresponde à pesquisa e aos filtros atuais.
| Posição | Modelo | Empresa | Pontuação de Conhecimentos gerais | Pontuação | Custo total | Testes corretos | Tempo de resposta (médio) |
|---|---|---|---|---|---|---|---|
| #144 | Ring-2.6-1T none | Inclusionai | 3.0 | 4.8 | $0.026 | 0/1 | 133.6s |
| #145 | GPT-5.4 Nano none | OpenAI | 3.0 | 4.8 | $0.011 | 0/1 | 773ms |
| #146 | MiniMax M2.5 medium | Minimax | 3.0 | 4.7 | $0.303 | 0/1 | 80.8s |
| #147 | Ling-2.6-1T none | Inclusionai | 3.0 | 4.7 | $0.005 | 0/1 | 0ms |
| #148 | Qwen3 Coder Next medium | Qwen | 3.0 | 4.7 | $0.008 | 0/1 | 399ms |
| #150 | Laguna M.1 none | Poolside | 3.0 | 4.6 | $0.000 | 0/1 | 0ms |
| #151 | Mercury 2 none | Inception | 3.0 | 4.6 | $0.011 | 0/1 | 548ms |
| #152 | Elephant Alpha none | Openrouter | 3.0 | 4.6 | $0.000 | 0/1 | 0ms |
| #153 | Elephant Alpha medium | Openrouter | 3.0 | 4.5 | $0.000 | 0/1 | 0ms |
| #156 | Laguna Xs.2 medium | Poolside | 3.0 | 4.3 | $0.000 | 0/1 | 0ms |
| #157 | GLM 4.7 Flash medium | Z.ai | 3.0 | 4.3 | $0.054 | 0/1 | 11.1s |
| #158 | Hy3 preview none | Tencent | 3.0 | 4.3 | $0.003 | 0/1 | 2.71s |
| #159 | MiMo-V2-Flash none | Xiaomi | 3.0 | 4.3 | $0.025 | 0/1 | 1.82s |
| #160 | Grok Build 0.1 none | X AI | 3.0 | 4.2 | $0.547 | 0/1 | 36.1s |
| #161 | Grok 4.1 Fast none | X AI | 3.0 | 4.0 | $0.008 | 0/1 | 731ms |