Categoría AI BENCHY
Ranking de Específico del dominio
Mira qué modelos de IA rinden mejor en Específico del dominio, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Métrica ↑.
Modelos mostrados
15
Promedio de Puntuación de Específico del dominio
4.8
Mejor modelo
GLM 5 Turbo 2.9| Rango | Modelo | Empresa | Puntuación de Específico del dominio | Puntuación | Pruebas correctas | Tiempo de respuesta (promedio) |
|---|---|---|---|---|---|---|
| #56 | MiMo-V2.5 medium | Xiaomi | 5.3 | 7.3 | 1/3 | 34.5s |
| #58 | Gemini 3.1 Flash Lite Preview none | 5.3 | 7.2 | 1/3 | 942ms | |
| #61 | Gemini 3.1 Flash Lite low | 5.3 | 7.2 | 1/3 | 1.52s | |
| #65 | Grok 4.20 medium | X AI | 5.3 | 7.1 | 1/3 | 27.0s |
| #95 | Qwen3.5 Plus 2026-02-15 none | Qwen | 5.3 | 6.3 | 1/3 | 1.17s |
| #101 | Mimo V2 Omni none | Xiaomi | 5.3 | 6.0 | 1/3 | 2.10s |
| #104 | Nemotron 3 Ultra 550b A55b none | NVIDIA | 5.3 | 6.0 | 1/3 | 698ms |
| #109 | GLM 5V Turbo none | Z.ai | 5.3 | 5.8 | 1/3 | 2.09s |
| #111 | Owl Alpha medium | Openrouter | 5.3 | 5.7 | 1/3 | 8.58s |
| #113 | DeepSeek V4 Pro none | DeepSeek | 5.3 | 5.7 | 1/3 | 3.17s |
| #114 | Qwen3.5 Plus 2026-04-20 none | Qwen | 5.3 | 5.7 | 1/3 | 4.43s |
| #116 | Hunter Alpha none | OpenRouter | 5.3 | 5.7 | 1/3 | 2.33s |
| #121 | Owl Alpha none | Openrouter | 5.3 | 5.5 | 1/3 | 3.00s |
| #123 | MiMo-V2.5-Pro none | Xiaomi | 5.3 | 5.5 | 1/3 | 877ms |
| #128 | Qwen3.6 Flash none | Qwen | 5.3 | 5.4 | 1/3 | 1.11s |