データ解析と抽出モデルランキング

データ解析と抽出でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。

表示モデル数

平均データ解析と抽出スコア

8.9

最良モデル

DeepSeek V4 Flash 10.0

失敗理由

失敗理由不正解で41 失敗理由 API エラーで14 失敗理由回答なしで8 失敗理由余分な書式で6 失敗理由タイムアウトで1

210/210

順位	モデル	企業	データ解析と抽出スコア	スコア	合計コスト	正解テスト	応答時間（平均）
#13	GPT-5.3-Codex medium	OpenAI	10.0	8.9	$0.920	2/2	3.07s
合計テスト数 2 誤答テスト数 0 合計コスト $0.920 応答時間（平均） 3.07s
#15	Claude Opus 4.7 medium	Anthropic	10.0	8.7	$1.477	2/2	2.37s
合計テスト数 2 誤答テスト数 0 合計コスト $1.477 応答時間（平均） 2.37s
#16	Muse Spark 1.1 medium	Meta	10.0	8.6	$1.357	2/2	4.96s
合計テスト数 2 誤答テスト数 0 合計コスト $1.357 応答時間（平均） 4.96s
#17	Claude Fable 5 medium	Anthropic	10.0	8.6	$3.478	2/2	7.18s
合計テスト数 2 誤答テスト数 0 合計コスト $3.478 応答時間（平均） 7.18s
#18	GPT-5.4 medium	OpenAI	10.0	8.5	$1.533	2/2	5.32s
合計テスト数 2 誤答テスト数 0 合計コスト $1.533 応答時間（平均） 5.32s
#19	Qwen3.6 Max Preview medium	Qwen	10.0	8.4	$1.143	2/2	41.2s
合計テスト数 2 誤答テスト数 0 合計コスト $1.143 応答時間（平均） 41.2s
#20	Grok 4.5 low	X AI	10.0	8.4	$0.935	2/2	3.44s
合計テスト数 2 誤答テスト数 0 合計コスト $0.935 応答時間（平均） 3.44s
#21	GPT-5.2 medium	OpenAI	10.0	8.4	$0.951	2/2	3.15s
合計テスト数 2 誤答テスト数 0 合計コスト $0.951 応答時間（平均） 3.15s
#22	Grok 4.5 medium	X AI	10.0	8.3	$1.928	2/2	6.29s
合計テスト数 2 誤答テスト数 0 合計コスト $1.928 応答時間（平均） 6.29s
#23	Claude Sonnet 5 medium	Anthropic	10.0	8.3	$0.922	2/2	3.16s
合計テスト数 2 誤答テスト数 0 合計コスト $0.922 応答時間（平均） 3.16s
#24	Muse Spark 1.1 low	Meta	10.0	8.3	$0.647	2/2	3.22s
合計テスト数 2 誤答テスト数 0 合計コスト $0.647 応答時間（平均） 3.22s
#25	Gemini 2.5 Flash medium	Google	10.0	8.2	$0.643	2/2	4.06s
合計テスト数 2 誤答テスト数 0 合計コスト $0.643 応答時間（平均） 4.06s
#26	GPT-5 Mini medium	OpenAI	10.0	8.1	$0.237	2/2	12.6s
合計テスト数 2 誤答テスト数 0 合計コスト $0.237 応答時間（平均） 12.6s
#27	Muse Spark 1.1 high	Meta	10.0	8.1	$1.694	2/2	8.40s
合計テスト数 2 誤答テスト数 0 合計コスト $1.694 応答時間（平均） 8.40s
#28	Inkling high	Thinkingmachines	10.0	8.0	$1.006	2/2	8.19s
合計テスト数 2 誤答テスト数 0 合計コスト $1.006 応答時間（平均） 8.19s

データ解析と抽出ランキング

モデルを絞り込む

データ解析と抽出スコア上位モデル

データ解析と抽出スコア vs 合計コスト

応答時間（平均）上位モデル

データ解析と抽出 ランキング

モデルを絞り込む

データ解析と抽出 スコア 上位モデル

データ解析と抽出 スコア vs 合計コスト

応答時間（平均） 上位モデル

データ解析と抽出ランキング

データ解析と抽出スコア上位モデル

データ解析と抽出スコア vs 合計コスト

応答時間（平均）上位モデル