AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY

変更履歴

日付ごとにまとめた、製品とベンチマーク更新のシンプルな記録です。新たにテストしたモデル、再テスト、ベンチマーク変更、公開済みの UX/製品改善をここに記録します。

2026-04-23

  • 新しくテストしたモデル: inclusionai/ling-2.6-1t:free InclusionAI Ling 2.6 1T Free のベンチマーク対象を追加しました。
  • 新機能: 実行履歴 - モデルページで過去の公開実行履歴と実行同士の並列比較テーブルを表示するようになりました。 (モデルページの例)
  • UX: リーダーボードは URL ベースのページネーション、フィルター、ランキング一覧からの直接比較操作に対応しました。
  • バグ修正: トップページの検索、フィルター件数、ページネーション状態がデータセット全体で一貫して保たれるようになりました。
  • 再テスト: z-ai/glm-5.1 完全なベンチマークスイートを再実行し、このモデルの公開実行履歴スナップショットを整理しました。
  • バグ修正: 実際には再テストしていない無関係なモデルに新しい tested_at タイムスタンプが付かないようにしました。

変更ログページを作成しました

この変更ログは公開後に開始したため、古い更新の一部はここに載っていません。

2026-02-15

  • 初回リリース