2026-05-22
- Model baru yang diuji: Qwen3.7 Max Menambahkan cakupan benchmark untuk Qwen 3.7 Max.
- Tes baru ditambahkan: Menambahkan kategori tes Coding baru yang berfokus pada pencarian bug dalam solusi C++.
AI BENCHY
Log sederhana untuk pembaruan produk dan benchmark, dikelompokkan berdasarkan tanggal. Kami menggunakannya untuk mencatat model yang baru diuji, uji ulang, perubahan benchmark, dan pekerjaan UX/produk yang sudah dirilis.
Halaman changelog dibuat
Changelog ini dimulai setelah peluncuran, jadi beberapa pembaruan lama tidak tercantum di sini.