2026-05-22
- Modele nou testate: Qwen3.7 Max Am adăugat acoperire de benchmark pentru Qwen 3.7 Max.
- Teste noi adăugate: Am adăugat o nouă categorie de test Coding axată pe găsirea de bug-uri în soluții C++.
AI BENCHY
Un jurnal simplu al actualizărilor de produs și benchmark, grupat după dată. Îl folosim pentru a nota modelele nou testate, retestările, schimbările de benchmark și lucrările UX/produs lansate.
Pagină de jurnal creată
Acest changelog a început după lansare, așa că unele actualizări mai vechi lipsesc de aici.