AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Categoría AI BENCHY

Ranking de Programación

Mira qué modelos de IA rinden mejor en Programación, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↑.

Modelos mostrados

15

Promedio de Puntuación de Programación

7.2

Rango Modelo Empresa Puntuación de Programación Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#27 Gemini 3.1 Flash Lite Preview none Google 10.0 7.9 1/1 1.47s
#51 Mercury 2 medium Inception 10.0 6.5 1/1 1.53s
#19 Gemini 3 Flash Preview none Google 10.0 8.1 1/1 1.59s
#86 Qwen3 Coder Next medium Qwen 4.7 4.7 0/1 1.69s
#52 MiMo-V2-Omni none Xiaomi 6.6 6.5 0/1 1.72s
#89 Grok 4.1 Fast none X AI 5.3 4.5 0/1 1.79s
#20 Gemini 3.1 Flash Lite Preview low Google 10.0 8.1 1/1 2.20s
#64 Qwen3.5-27B none Qwen 10.0 5.9 1/1 2.51s
#83 GPT-4o-mini none OpenAI 3.0 4.9 0/1 2.55s
#60 Qwen3.5-35B-A3B none Qwen 10.0 6.1 1/1 2.67s
#88 MiMo-V2-Flash none Xiaomi 6.3 4.5 0/1 2.79s
#63 GPT-5.4 none OpenAI 10.0 5.9 1/1 2.95s
#82 Nemotron 3 Super none NVIDIA 3.3 5.1 0/1 2.99s
#81 Qwen3 Coder Next none Qwen 7.3 5.1 0/1 3.14s
#66 Qwen3.5-122B-A10B none Qwen 4.3 5.7 0/1 3.44s

Mejores modelos por Puntuación de Programación

Puntuación de Programación vs costo total

Mejores modelos por Tiempo de respuesta (promedio)