汎用知能 x API エラーランキング

汎用知能で API エラーが起きやすいAIモデルを確認し、弱点を早く見つけられます。並び替え: 正解テスト ↑.

表示モデル数

総失敗数

最も影響を受けたモデル

Nemotron 3 Ultra 1

失敗理由

指示に従っていない78 不正解59 API エラー12 タイムアウト4

カテゴリ

コーディング45 複合26 ツール呼び出し17 データ解析と抽出14 反AIトリック14 雑学13 パズル解決12 汎用知能12 ドメイン特化7 指示追従1

12/12

順位	モデル	企業	API エラー件数	カテゴリスコア	合計コスト	正解テスト	応答時間（平均）
#51	Nemotron 3 Ultra medium	NVIDIA	1	3.7	$0.774	0/1	2.52s
合計テスト数 1 誤答テスト数 1 合計コスト $0.774 応答時間（平均） 2.52s
#76	DeepSeek V3.2 medium	DeepSeek	1	3.4	$0.078	0/1	58.3s
合計テスト数 1 誤答テスト数 1 合計コスト $0.078 応答時間（平均） 58.3s
#135	Hy3 preview high	Tencent	1	3.0	$0.048	0/1	0ms
合計テスト数 1 誤答テスト数 1 合計コスト $0.048 応答時間（平均） 0ms
#153	Hy3 preview low	Tencent	1	3.0	$0.015	0/1	0ms
合計テスト数 1 誤答テスト数 1 合計コスト $0.015 応答時間（平均） 0ms
#173	DeepSeek V3.2 none	DeepSeek	1	4.7	$0.054	0/1	9.32s
合計テスト数 1 誤答テスト数 1 合計コスト $0.054 応答時間（平均） 9.32s
#175	Qwen3.6 Plus Preview medium	Qwen	1	3.0	$0.000	0/1	0ms
合計テスト数 1 誤答テスト数 1 合計コスト $0.000 応答時間（平均） 0ms
#186	Laguna M.1 medium	Poolside	1	3.0	$0.033	0/1	0ms
合計テスト数 1 誤答テスト数 1 合計コスト $0.033 応答時間（平均） 0ms
#192	Laguna M.1 none	Poolside	1	3.0	$0.009	0/1	0ms
合計テスト数 1 誤答テスト数 1 合計コスト $0.009 応答時間（平均） 0ms
#198	Laguna Xs.2 medium	Poolside	1	3.0	$0.015	0/1	0ms
合計テスト数 1 誤答テスト数 1 合計コスト $0.015 応答時間（平均） 0ms
#205	Laguna Xs.2 none	Poolside	1	3.0	$0.004	0/1	0ms
合計テスト数 1 誤答テスト数 1 合計コスト $0.004 応答時間（平均） 0ms
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1	3.0	$0.000	0/1	0ms
合計テスト数 1 誤答テスト数 1 合計コスト $0.000 応答時間（平均） 0ms
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	1	3.0	$0.000	0/1	0ms
合計テスト数 1 誤答テスト数 1 合計コスト $0.000 応答時間（平均） 0ms

モデルを絞り込む

API エラー件数上位モデル

API エラー件数対スコア

応答時間（平均）上位モデル

推定無駄コスト上位モデル

汎用知能: API エラー

モデルを絞り込む

API エラー 件数 上位モデル

API エラー 件数 対 スコア

応答時間（平均） 上位モデル

推定無駄コスト 上位モデル

API エラー件数上位モデル

API エラー件数対スコア

応答時間（平均）上位モデル

推定無駄コスト上位モデル