データ解析と抽出モデルランキング

データ解析と抽出でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。

表示モデル数

平均データ解析と抽出スコア

8.9

最良モデル

DeepSeek V4 Flash 10.0

失敗理由

失敗理由不正解で41 失敗理由 API エラーで14 失敗理由回答なしで8 失敗理由余分な書式で6 失敗理由タイムアウトで1

216/216

順位	モデル	企業	データ解析と抽出スコア	スコア	合計コスト	正解テスト	応答時間（平均）
#191	Grok 4.1 Fast medium	X AI	10.0	4.7	$0.069	2/2	6.63s
合計テスト数 2 誤答テスト数 0 合計コスト $0.069 応答時間（平均） 6.63s
#192	Laguna M.1 medium	Poolside	10.0	4.7	$0.033	2/2	4.93s
合計テスト数 2 誤答テスト数 0 合計コスト $0.033 応答時間（平均） 4.93s
#197	Grok 4.20 Beta none	X AI	10.0	4.4	$0.087	2/2	601ms
合計テスト数 2 誤答テスト数 0 合計コスト $0.087 応答時間（平均） 601ms
#198	Laguna M.1 none	Poolside	10.0	4.4	$0.009	2/2	3.37s
合計テスト数 2 誤答テスト数 0 合計コスト $0.009 応答時間（平均） 3.37s
#202	Hunter Alpha none	OpenRouter	10.0	4.2	$0.000	2/2	8.49s
合計テスト数 2 誤答テスト数 0 合計コスト $0.000 応答時間（平均） 8.49s
#203	Grok 4.20 none	X AI	10.0	4.1	$0.057	2/2	522ms
合計テスト数 2 誤答テスト数 0 合計コスト $0.057 応答時間（平均） 522ms
#209	Grok 4.1 Fast none	X AI	10.0	3.8	$0.008	2/2	943ms
合計テスト数 2 誤答テスト数 0 合計コスト $0.008 応答時間（平均） 943ms
#211	Laguna Xs.2 none	Poolside	10.0	3.8	$0.004	2/2	646ms
合計テスト数 2 誤答テスト数 0 合計コスト $0.004 応答時間（平均） 646ms
#82	Mercury 2 medium	Inception	7.3	7.0	$0.093	1/2	1.11s
合計テスト数 2 誤答テスト数 1 合計コスト $0.093 応答時間（平均） 1.11s
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	7.3	6.9	$0.467	1/2	4.70s
合計テスト数 2 誤答テスト数 1 合計コスト $0.467 応答時間（平均） 4.70s
#120	Qwen3.5-Flash medium	Qwen	7.3	6.2	$0.139	1/2	57.0s
合計テスト数 2 誤答テスト数 1 合計コスト $0.139 応答時間（平均） 57.0s
#125	Qwen3.5-35B-A3B medium	Qwen	7.3	6.2	$0.837	1/2	59.3s
合計テスト数 2 誤答テスト数 1 合計コスト $0.837 応答時間（平均） 59.3s
#173	Mistral Small 4 medium	Mistral	7.3	5.1	$0.096	1/2	1.23s
合計テスト数 2 誤答テスト数 1 合計コスト $0.096 応答時間（平均） 1.23s
#195	Mercury 2 none	Inception	7.3	4.6	$0.030	1/2	667ms
合計テスト数 2 誤答テスト数 1 合計コスト $0.030 応答時間（平均） 667ms
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	7.3	3.4	$0.000	1/2	2.72s
合計テスト数 2 誤答テスト数 1 合計コスト $0.000 応答時間（平均） 2.72s

データ解析と抽出ランキング

モデルを絞り込む

データ解析と抽出スコア上位モデル

データ解析と抽出スコア vs 合計コスト

応答時間（平均）上位モデル

データ解析と抽出 ランキング

モデルを絞り込む

データ解析と抽出 スコア 上位モデル

データ解析と抽出 スコア vs 合計コスト

応答時間（平均） 上位モデル

データ解析と抽出ランキング

データ解析と抽出スコア上位モデル

データ解析と抽出スコア vs 合計コスト

応答時間（平均）上位モデル