データ解析と抽出 x 回答なしランキング | AI BENCHY

データ解析と抽出で回答なしが起きやすいAIモデルを確認し、弱点を早く見つけられます。並び替え: 失敗数 ↑.

表示モデル数

7

総失敗数

8

最も影響を受けたモデル

失敗理由

不正解41 API エラー14 回答なし8 余分な書式6 タイムアウト1

カテゴリ

複合29 コーディング18 雑学13 データ解析と抽出8 ドメイン特化8 反AIトリック4 パズル解決3 ツール呼び出し2 指示追従2

7/7

順位	モデル	企業	回答なし件数	カテゴリスコア	合計コスト	正解テスト	応答時間（平均）
#42	GLM 5 medium	Z.ai	1	7.1	$0.307	1/2	8.90s
合計テスト数 2 誤答テスト数 1 合計コスト $0.307 応答時間（平均） 8.90s
#60	LongCat 2.0 medium	Meituan	1	6.3	$0.478	1/2	10.6s
合計テスト数 2 誤答テスト数 1 合計コスト $0.478 応答時間（平均） 10.6s
#91	LongCat 2.0 low	Meituan	1	6.3	$0.391	1/2	10.8s
合計テスト数 2 誤答テスト数 1 合計コスト $0.391 応答時間（平均） 10.8s
#97	LongCat 2.0 high	Meituan	1	3.6	$0.469	0/2	11.0s
合計テスト数 2 誤答テスト数 2 合計コスト $0.469 応答時間（平均） 11.0s
#194	GLM 4.7 Flash medium	Z.ai	1	6.3	$0.166	1/2	1.51s
合計テスト数 2 誤答テスト数 1 合計コスト $0.166 応答時間（平均） 1.51s
#198	Laguna Xs.2 medium	Poolside	1	7.1	$0.015	1/2	9.34s
合計テスト数 2 誤答テスト数 1 合計コスト $0.015 応答時間（平均） 9.34s
#99	Qwen3.6 27B medium	Qwen	2	3.5	$0.779	0/2	37.3s
合計テスト数 2 誤答テスト数 2 合計コスト $0.779 応答時間（平均） 37.3s

回答なし件数上位モデル

回答なし件数対スコア

応答時間（平均）上位モデル

推定無駄コスト上位モデル