Categoría AI BENCHY
Ranking de Inteligencia general
Mira qué modelos de IA rinden mejor en Inteligencia general, cuáles se mantienen fiables y dónde aparecen las mayores diferencias.
Modelos mostrados
15
Promedio de Puntuación de Inteligencia general
5.9
Mejor modelo
Gemini 3 Flash Preview 10.0| Rango | Modelo | Empresa | Puntuación de Inteligencia general | Puntuación | Pruebas correctas | Tiempo de respuesta (promedio) |
|---|---|---|---|---|---|---|
| #63 | GPT-5.3 Chat none | OpenAI | 4.6 | 7.2 | 0/1 | 1.99s |
| #109 | GLM 5V Turbo none | Z.ai | 4.6 | 5.8 | 0/1 | 2.22s |
| #141 | Nemotron 3 Super none | NVIDIA | 4.6 | 4.9 | 0/1 | 950ms |
| #152 | MiMo-V2-Flash none | Xiaomi | 4.6 | 4.6 | 0/1 | 1.67s |
| #45 | GPT-5.4 Mini medium | OpenAI | 4.5 | 7.5 | 0/1 | 3.72s |
| #54 | GPT-5 Mini medium | OpenAI | 4.5 | 7.3 | 0/1 | 13.5s |
| #70 | GPT-5.4 Nano medium | OpenAI | 4.5 | 7.0 | 0/1 | 4.15s |
| #151 | Trinity Large Preview none | Arcee AI | 4.5 | 4.6 | 0/1 | 873ms |
| #46 | Qwen3.6 35B A3B medium | Qwen | 4.4 | 7.4 | 0/1 | 8.66s |
| #47 | Grok Build 0.1 medium | X AI | 4.4 | 7.4 | 0/1 | 18.4s |
| #125 | GPT-5.4 none | OpenAI | 4.4 | 5.5 | 0/1 | 1.78s |
| #143 | MiMo-V2.5 none | Xiaomi | 4.4 | 4.9 | 0/1 | 6.86s |
| #154 | Qwen3.5-9B none | Qwen | 4.4 | 4.6 | 0/1 | 552ms |
| #157 | Grok 4.1 Fast none | X AI | 4.4 | 4.4 | 0/1 | 1.08s |
| #24 | GPT-5.2 Chat none | OpenAI | 4.4 | 7.9 | 0/1 | 3.20s |