ドメイン特化 x タイムアウトランキング

ドメイン特化でタイムアウトが起きやすいAIモデルを確認し、弱点を早く見つけられます。並び替え: 失敗数 ↑.

表示モデル数

総失敗数

最も影響を受けたモデル

Claude Opus 4.7 1

失敗理由

不正解412 タイムアウト43 余分な書式17 回答なし8 API エラー7 指示に従っていない1

カテゴリ

ドメイン特化43 コーディング26 パズル解決5 複合5 反AIトリック4 汎用知能4 データ解析と抽出1 指示追従1

32/32

順位	モデル	企業	タイムアウト件数	カテゴリスコア	合計コスト	正解テスト	応答時間（平均）
#15	Claude Opus 4.7 medium	Anthropic	1	7.7	$1.477	2/3	1.17s
合計テスト数 3 誤答テスト数 1 合計コスト $1.477 応答時間（平均） 1.17s
#21	GPT-5.2 medium	OpenAI	1	5.9	$0.951	1/3	77.8s
合計テスト数 3 誤答テスト数 2 合計コスト $0.951 応答時間（平均） 77.8s
#26	GPT-5 Mini medium	OpenAI	1	3.6	$0.237	0/3	44.6s
合計テスト数 3 誤答テスト数 3 合計コスト $0.237 応答時間（平均） 44.6s
#31	GLM 5.2 high	Z.ai	1	3.7	$0.970	0/3	74.0s
合計テスト数 3 誤答テスト数 3 合計コスト $0.970 応答時間（平均） 74.0s
#38	GLM 5.2 medium	Z.ai	1	4.1	$0.222	0/3	45.5s
合計テスト数 3 誤答テスト数 3 合計コスト $0.222 応答時間（平均） 45.5s
#40	Claude Sonnet 4.6 medium	Anthropic	1	2.9	$2.057	0/3	0ms
合計テスト数 3 誤答テスト数 3 合計コスト $2.057 応答時間（平均） 0ms
#42	GLM 5 medium	Z.ai	1	3.5	$0.307	0/3	0ms
合計テスト数 3 誤答テスト数 3 合計コスト $0.307 応答時間（平均） 0ms
#49	GLM 5 Turbo medium	Z.ai	1	2.9	$0.323	0/3	71.1s
合計テスト数 3 誤答テスト数 3 合計コスト $0.323 応答時間（平均） 71.1s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	1	5.3	$0.437	1/3	17.5s
合計テスト数 3 誤答テスト数 2 合計コスト $0.437 応答時間（平均） 17.5s
#58	Qwen3.5-27B medium	Qwen	1	5.3	$1.627	1/3	79.5s
合計テスト数 3 誤答テスト数 2 合計コスト $1.627 応答時間（平均） 79.5s
#60	LongCat 2.0 medium	Meituan	1	2.9	$0.478	0/3	339.9s
合計テスト数 3 誤答テスト数 3 合計コスト $0.478 応答時間（平均） 339.9s
#74	GLM 5.1 medium	Z.ai	1	5.3	$0.535	1/3	29.8s
合計テスト数 3 誤答テスト数 2 合計コスト $0.535 応答時間（平均） 29.8s
#76	DeepSeek V3.2 medium	DeepSeek	1	2.9	$0.078	0/3	24.3s
合計テスト数 3 誤答テスト数 3 合計コスト $0.078 応答時間（平均） 24.3s
#77	Kimi K2.5 medium	Moonshot AI	1	3.5	$0.600	0/3	137.3s
合計テスト数 3 誤答テスト数 3 合計コスト $0.600 応答時間（平均） 137.3s
#91	LongCat 2.0 low	Meituan	1	3.0	$0.391	0/3	86.1s
合計テスト数 3 誤答テスト数 3 合計コスト $0.391 応答時間（平均） 86.1s

モデルを絞り込む

タイムアウト件数上位モデル

タイムアウト件数対スコア

応答時間（平均）上位モデル

推定無駄コスト上位モデル

ドメイン特化: タイムアウト

モデルを絞り込む

タイムアウト 件数 上位モデル

タイムアウト 件数 対 スコア

応答時間（平均） 上位モデル

推定無駄コスト 上位モデル

タイムアウト件数上位モデル

タイムアウト件数対スコア

応答時間（平均）上位モデル

推定無駄コスト上位モデル