AI BENCHY 失敗分析
余分な書式 の失敗
どのAIモデルで 余分な書式 が起きやすいかを確認し、選ぶ前に信頼性のリスクを見極められます。 並び替え: 合計コスト ↓.
32/32
モデルを絞り込む
現在の検索条件とフィルターに一致するモデルはありません。
| 順位 | モデル | 企業 | 余分な書式 件数 | スコア | 合計コスト | 正解テスト | 応答時間(平均) |
|---|---|---|---|---|---|---|---|
| #131 | North Mini Code none | Cohere | 2 | 5.1 | $0.000 | 4/21 | 29.8s |
| #132 | Hunter Alpha medium | OpenRouter | 1 | 5.1 | $0.000 | 8/18 | 10.3s |