データ解析と抽出モデルランキング

データ解析と抽出でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。並び替え: 正解テスト ↑.

表示モデル数

平均データ解析と抽出スコア

8.9

最良モデル

LongCat 2.0 3.6

失敗理由

失敗理由不正解で41 失敗理由 API エラーで14 失敗理由回答なしで8 失敗理由余分な書式で6 失敗理由タイムアウトで1

216/216

順位	モデル	企業	データ解析と抽出スコア	スコア	合計コスト	正解テスト	応答時間（平均）
#125	Qwen3.5-35B-A3B medium	Qwen	7.3	6.2	$0.837	1/2	59.3s
合計テスト数 2 誤答テスト数 1 合計コスト $0.837 応答時間（平均） 59.3s
#127	gpt-oss-120b medium	OpenAI	6.4	6.1	$0.019	1/2	1.98s
合計テスト数 2 誤答テスト数 1 合計コスト $0.019 応答時間（平均） 1.98s
#141	Hy3 preview high	Tencent	6.5	5.9	$0.048	1/2	12.1s
合計テスト数 2 誤答テスト数 1 合計コスト $0.048 応答時間（平均） 12.1s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	6.5	5.6	$0.077	1/2	3.59s
合計テスト数 2 誤答テスト数 1 合計コスト $0.077 応答時間（平均） 3.59s
#155	KAT-Coder-Air V2.5 medium	Kwaipilot	6.5	5.6	$0.048	1/2	3.65s
合計テスト数 2 誤答テスト数 1 合計コスト $0.048 応答時間（平均） 3.65s
#158	Qwen3.6 27B none	Qwen	7.3	5.5	$0.087	1/2	2.06s
合計テスト数 2 誤答テスト数 1 合計コスト $0.087 応答時間（平均） 2.06s
#159	Hy3 preview low	Tencent	6.5	5.5	$0.015	1/2	5.85s
合計テスト数 2 誤答テスト数 1 合計コスト $0.015 応答時間（平均） 5.85s
#161	Kimi K2.5 none	Moonshot AI	7.3	5.5	$0.127	1/2	42.1s
合計テスト数 2 誤答テスト数 1 合計コスト $0.127 応答時間（平均） 42.1s
#164	KAT-Coder-Air V2.5 low	Kwaipilot	6.5	5.4	$0.041	1/2	2.82s
合計テスト数 2 誤答テスト数 1 合計コスト $0.041 応答時間（平均） 2.82s
#172	Qwen3 Coder Next none	Qwen	6.5	5.1	$0.025	1/2	1.32s
合計テスト数 2 誤答テスト数 1 合計コスト $0.025 応答時間（平均） 1.32s
#173	Mistral Small 4 medium	Mistral	7.3	5.1	$0.096	1/2	1.23s
合計テスト数 2 誤答テスト数 1 合計コスト $0.096 応答時間（平均） 1.23s
#174	MiMo-V2.5 none	Xiaomi	6.5	5.1	$0.025	1/2	1.01s
合計テスト数 2 誤答テスト数 1 合計コスト $0.025 応答時間（平均） 1.01s
#178	MiniMax M2.7 medium	Minimax	6.3	5.0	$0.163	1/2	21.9s
合計テスト数 2 誤答テスト数 1 合計コスト $0.163 応答時間（平均） 21.9s
#179	DeepSeek V3.2 none	DeepSeek	6.3	5.0	$0.054	1/2	9.42s
合計テスト数 2 誤答テスト数 1 合計コスト $0.054 応答時間（平均） 9.42s
#182	GLM 4.7 Flash none	Z.ai	7.3	4.9	$0.016	1/2	4.82s
合計テスト数 2 誤答テスト数 1 合計コスト $0.016 応答時間（平均） 4.82s

データ解析と抽出ランキング

モデルを絞り込む

データ解析と抽出スコア上位モデル

データ解析と抽出スコア vs 合計コスト

応答時間（平均）上位モデル

データ解析と抽出 ランキング

モデルを絞り込む

データ解析と抽出 スコア 上位モデル

データ解析と抽出 スコア vs 合計コスト

応答時間（平均） 上位モデル

データ解析と抽出ランキング

データ解析と抽出スコア上位モデル

データ解析と抽出スコア vs 合計コスト

応答時間（平均）上位モデル