2026-05-22
- Nouveaux modèles testés: Qwen3.7 Max Ajout de la couverture de benchmark pour Qwen 3.7 Max.
- Nouveaux tests ajoutés: Ajout d'une nouvelle catégorie de test Coding axée sur la recherche de bugs dans des solutions C++.
AI BENCHY
Un journal simple des mises à jour produit et benchmark, regroupées par date. Nous l'utilisons pour noter les nouveaux modèles testés, les re-tests, les changements de benchmark et les évolutions UX/produit livrées.
Page de changelog créée
Ce changelog a commencé après le lancement, donc certaines mises à jour plus anciennes n’y figurent pas.