2026-05-22
- Novos modelos testados: Qwen3.7 Max Adicionada cobertura de benchmark para Qwen 3.7 Max.
- Novos testes adicionados: Adicionada uma nova categoria de teste Coding focada na busca de bugs em soluções C++.
AI BENCHY
Um registro simples de atualizações de produto e benchmark, agrupadas por data. Usamos isso para anotar modelos recém-testados, re-tests, mudanças no benchmark e trabalho de UX/produto já entregue.
Página de changelog criada
Este changelog começou após o lançamento, então algumas atualizações antigas não aparecem aqui.