2026-05-22
- 新しくテストしたモデル: Qwen3.7 Max Qwen 3.7 Max のベンチマーク対象を追加しました。
- 追加された新テスト: C++ ソリューションのバグ発見に焦点を当てた新しい Coding テストカテゴリを追加しました。
AI BENCHY
日付ごとにまとめた、製品とベンチマーク更新のシンプルな記録です。新たにテストしたモデル、再テスト、ベンチマーク変更、公開済みの UX/製品改善をここに記録します。
変更ログページを作成しました
この変更ログは公開後に開始したため、古い更新の一部はここに載っていません。