AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY カテゴリ別失敗

反AIトリック: 指示に従っていない

反AIトリック
指示に従っていない

反AIトリック で 指示に従っていない が起きやすいAIモデルを確認し、弱点を早く見つけられます。

表示モデル数

2

総失敗数

17

最も影響を受けたモデル

Gemini 3.1 Flash Lite Preview 1

指示に従っていない 件数 上位モデル

指示に従っていない 件数 対 スコア

応答時間(平均) 上位モデル

推定無駄コスト 上位モデル