データ解析と抽出 x API エラーランキング

データ解析と抽出で API エラーが起きやすいAIモデルを確認し、弱点を早く見つけられます。並び替え: 正解テスト ↑.

表示モデル数

総失敗数

最も影響を受けたモデル

Ring-2.6-1T 1

失敗理由

不正解41 API エラー14 回答なし8 余分な書式6 タイムアウト1

カテゴリ

コーディング45 複合26 ツール呼び出し17 データ解析と抽出14 反AIトリック14 雑学13 パズル解決12 汎用知能12 ドメイン特化7 指示追従1

14/14

順位	モデル	企業	API エラー件数	カテゴリスコア	合計コスト	正解テスト	応答時間（平均）
#179	Ring-2.6-1T none	Inclusionai	1	3.0	$0.026	0/2	45.9s
合計テスト数 2 誤答テスト数 2 合計コスト $0.026 応答時間（平均） 45.9s
#200	MiMo-V2-Flash none	Xiaomi	1	2.9	$0.025	0/2	19.7s
合計テスト数 2 誤答テスト数 2 合計コスト $0.025 応答時間（平均） 19.7s
#202	Grok Build 0.1 none	X AI	1	3.8	$0.547	0/2	9.33s
合計テスト数 2 誤答テスト数 2 合計コスト $0.547 応答時間（平均） 9.33s
#209	Step 3.5 Flash none	Stepfun	1	1.5	$0.020	0/1	0ms
合計テスト数 1 誤答テスト数 1 合計コスト $0.020 応答時間（平均） 0ms
#79	Gemini 3.5 Flash none	Google	1	6.5	$1.079	1/2	8.10s
合計テスト数 2 誤答テスト数 1 合計コスト $1.079 応答時間（平均） 8.10s
#100	Hy3 preview medium	Tencent	1	6.5	$0.018	1/2	5.25s
合計テスト数 2 誤答テスト数 1 合計コスト $0.018 応答時間（平均） 5.25s
#113	MiMo-V2-Flash medium	Xiaomi	1	6.5	$0.043	1/2	0ms
合計テスト数 2 誤答テスト数 1 合計コスト $0.043 応答時間（平均） 0ms
#114	Qwen3.5-Flash medium	Qwen	1	7.3	$0.139	1/2	57.0s
合計テスト数 2 誤答テスト数 1 合計コスト $0.139 応答時間（平均） 57.0s
#119	Qwen3.5-35B-A3B medium	Qwen	1	7.3	$0.837	1/2	59.3s
合計テスト数 2 誤答テスト数 1 合計コスト $0.837 応答時間（平均） 59.3s
#135	Hy3 preview high	Tencent	1	6.5	$0.048	1/2	12.1s
合計テスト数 2 誤答テスト数 1 合計コスト $0.048 応答時間（平均） 12.1s
#153	Hy3 preview low	Tencent	1	6.5	$0.015	1/2	5.85s
合計テスト数 2 誤答テスト数 1 合計コスト $0.015 応答時間（平均） 5.85s
#167	Mistral Small 4 medium	Mistral	1	7.3	$0.096	1/2	1.23s
合計テスト数 2 誤答テスト数 1 合計コスト $0.096 応答時間（平均） 1.23s
#199	Hy3 preview none	Tencent	1	6.5	$0.003	1/2	2.85s
合計テスト数 2 誤答テスト数 1 合計コスト $0.003 応答時間（平均） 2.85s
#206	gpt-oss-120b none	OpenAI	1	6.5	$0.010	1/2	7.12s
合計テスト数 2 誤答テスト数 1 合計コスト $0.010 応答時間（平均） 7.12s

モデルを絞り込む

API エラー件数上位モデル

API エラー件数対スコア

応答時間（平均）上位モデル

推定無駄コスト上位モデル

データ解析と抽出: API エラー

モデルを絞り込む

API エラー 件数 上位モデル

API エラー 件数 対 スコア

応答時間（平均） 上位モデル

推定無駄コスト 上位モデル

API エラー件数上位モデル

API エラー件数対スコア

応答時間（平均）上位モデル

推定無駄コスト上位モデル