AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY 失敗分析

API エラー の失敗

どのAIモデルで API エラー が起きやすいかを確認し、選ぶ前に信頼性のリスクを見極められます。 並び替え: 正解テスト ↑.

表示モデル数

15

総失敗数

144

最も影響を受けたモデル

Nemotron 3 Nano Omni 30b A3b Reasoning 6
順位 モデル 企業 API エラー 件数 スコア 正解テスト 応答時間(平均)
#136 Elephant Alpha medium Openrouter 3 5.1 6/21 1.27s
#138 Ling-2.6-flash none Inclusionai 2 5.0 6/21 9.34s
#107 Laguna Xs.2 medium Poolside 4 5.8 6/19 6.73s
#126 gpt-oss-120b none OpenAI 3 5.4 6/19 21.6s
#113 DeepSeek V4 Pro none DeepSeek 1 5.7 7/21 12.4s
#116 Hunter Alpha none OpenRouter 1 5.7 6/18 4.70s
#119 Cobuddy medium Baidu 1 5.6 7/21 39.9s
#120 Mimo V2 PRO none Xiaomi 1 5.6 7/21 2.27s
#100 Grok Build 0.1 none X AI 3 6.0 7/19 28.7s
#101 Mimo V2 Omni none Xiaomi 1 6.0 8/21 2.44s
#103 DeepSeek V4 Pro high DeepSeek 5 6.0 8/21 65.2s
#105 Nemotron 3 Super medium NVIDIA 3 5.8 8/21 32.0s
#111 Owl Alpha medium Openrouter 1 5.7 8/21 11.9s
#96 Ring-2.6-1T none Inclusionai 5 6.2 9/21 55.1s
#79 Hunter Alpha medium OpenRouter 1 6.7 8/18 10.3s

API エラー 件数 上位モデル

API エラー 件数 対 スコア

応答時間(平均) 上位モデル