AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Categoría AI BENCHY

Ranking de Programación

Mira qué modelos de IA rinden mejor en Programación, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↑.

Modelos mostrados

15

Promedio de Puntuación de Programación

6.1

Rango Modelo Empresa Puntuación de Programación Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#114 GPT-5.4 none OpenAI 6.8 5.6 1/2 1.99s
#133 Qwen3 Coder Next none Qwen 5.4 5.1 0/2 2.01s
#144 MiMo-V2-Flash none Xiaomi 4.9 4.7 0/2 2.04s
#139 GPT-4o-mini none OpenAI 3.2 4.9 0/2 2.05s
#103 Qwen3.5 Plus 2026-04-20 none Qwen 4.4 5.8 0/2 2.08s
#125 Qwen3.5-122B-A10B none Qwen 4.0 5.4 0/2 2.14s
#41 Gemini 3 Flash Preview none Google 6.8 7.7 1/2 2.19s
#87 Mercury 2 medium Inception 7.2 6.5 1/2 2.29s
#117 Qwen3.6 Flash none Qwen 6.6 5.5 1/2 2.34s
#89 Qwen3.5 Plus 2026-02-15 none Qwen 4.9 6.4 0/2 2.54s
#127 GLM 5 Turbo none Z.ai 4.4 5.3 0/2 2.58s
#110 MiMo-V2-Pro none Xiaomi 6.8 5.7 1/2 2.65s
#93 MiMo-V2-Omni none Xiaomi 5.1 6.2 0/2 2.75s
#10 Claude Opus 4.7 none Anthropic 10.0 8.9 1/1 2.84s
#124 Laguna M.1 none Poolside 7.5 5.4 0/1 2.93s

Mejores modelos por Puntuación de Programación

Puntuación de Programación vs costo total

Mejores modelos por Tiempo de respuesta (promedio)