パズル解決 x API エラーランキング

パズル解決で API エラーが起きやすいAIモデルを確認し、弱点を早く見つけられます。並び替え: 正解テスト ↑.

表示モデル数

総失敗数

最も影響を受けたモデル

Laguna M.1 1

失敗理由

不正解201 指示に従っていない90 API エラー12 余分な書式8 タイムアウト5 回答なし3

カテゴリ

コーディング45 複合26 ツール呼び出し17 データ解析と抽出14 反AIトリック14 雑学13 パズル解決12 汎用知能12 ドメイン特化7 指示追従1

11/11

順位	モデル	企業	API エラー件数	カテゴリスコア	合計コスト	正解テスト	応答時間（平均）
#192	Laguna M.1 none	Poolside	1	3.0	$0.009	0/3	891ms
合計テスト数 3 誤答テスト数 3 合計コスト $0.009 応答時間（平均） 891ms
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1	2.9	$0.000	0/3	1.40s
合計テスト数 3 誤答テスト数 3 合計コスト $0.000 応答時間（平均） 1.40s
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	1	3.0	$0.000	0/3	532ms
合計テスト数 3 誤答テスト数 3 合計コスト $0.000 応答時間（平均） 532ms
#210	LFM2-24B-A2B none	Liquid	1	3.8	$0.001	0/3	1.78s
合計テスト数 3 誤答テスト数 3 合計コスト $0.001 応答時間（平均） 1.78s
#153	Hy3 preview low	Tencent	1	5.3	$0.015	1/3	7.51s
合計テスト数 3 誤答テスト数 2 合計コスト $0.015 応答時間（平均） 7.51s
#175	Qwen3.6 Plus Preview medium	Qwen	2	5.3	$0.000	1/3	7.52s
合計テスト数 3 誤答テスト数 2 合計コスト $0.000 応答時間（平均） 7.52s
#186	Laguna M.1 medium	Poolside	1	5.3	$0.033	1/3	10.2s
合計テスト数 3 誤答テスト数 2 合計コスト $0.033 応答時間（平均） 10.2s
#198	Laguna Xs.2 medium	Poolside	1	5.3	$0.015	1/3	1.93s
合計テスト数 3 誤答テスト数 2 合計コスト $0.015 応答時間（平均） 1.93s
#205	Laguna Xs.2 none	Poolside	1	5.3	$0.004	1/3	650ms
合計テスト数 3 誤答テスト数 2 合計コスト $0.004 応答時間（平均） 650ms
#135	Hy3 preview high	Tencent	1	7.7	$0.048	2/3	27.9s
合計テスト数 3 誤答テスト数 1 合計コスト $0.048 応答時間（平均） 27.9s
#173	DeepSeek V3.2 none	DeepSeek	1	7.6	$0.054	2/3	6.91s
合計テスト数 3 誤答テスト数 1 合計コスト $0.054 応答時間（平均） 6.91s

モデルを絞り込む

API エラー件数上位モデル

API エラー件数対スコア

応答時間（平均）上位モデル

推定無駄コスト上位モデル

パズル解決: API エラー

モデルを絞り込む

API エラー 件数 上位モデル

API エラー 件数 対 スコア

応答時間（平均） 上位モデル

推定無駄コスト 上位モデル

API エラー件数上位モデル

API エラー件数対スコア

応答時間（平均）上位モデル

推定無駄コスト上位モデル