AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY カテゴリ別失敗

パズル解決: 余分な書式

パズル解決
余分な書式

パズル解決 で 余分な書式 が起きやすいAIモデルを確認し、弱点を早く見つけられます。

表示モデル数

5

総失敗数

5

最も影響を受けたモデル

Mimo V2 PRO 1
順位 モデル 企業 余分な書式 件数 カテゴリスコア 正解テスト 応答時間(平均)
#51 Mimo V2 PRO medium Xiaomi 1 6.4 1/3 5.08s
#68 Claude Opus 4.8 none Anthropic 1 7.7 2/3 2.74s
#77 Claude Sonnet 4.6 none Anthropic 1 7.7 2/3 2.53s
#113 DeepSeek V4 Pro none DeepSeek 1 7.6 2/3 16.0s
#139 DeepSeek V4 Flash none DeepSeek 1 3.1 0/3 23.7s

余分な書式 件数 上位モデル

余分な書式 件数 対 スコア

応答時間(平均) 上位モデル

推定無駄コスト 上位モデル