2026-05-22
- Nuevos modelos probados: Qwen3.7 Max Se añadió cobertura de benchmark para Qwen 3.7 Max.
- Nuevas pruebas añadidas: Se añadió una nueva categoría de test Coding enfocada en la búsqueda de errores en soluciones C++.
AI BENCHY
Un registro simple de actualizaciones de producto y benchmark, agrupado por fecha. Lo usamos para anotar modelos recién probados, re-tests, cambios del benchmark y trabajo de UX/producto ya publicado.
Página de changelog creada
Este changelog empezó después del lanzamiento, así que faltan algunas actualizaciones anteriores.