データ解析と抽出モデルランキング

データ解析と抽出でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。並び替え: 指標 ↑.

表示モデル数

平均データ解析と抽出スコア

8.9

最良モデル

Step 3.5 Flash 1.5

失敗理由

失敗理由不正解で41 失敗理由 API エラーで14 失敗理由回答なしで8 失敗理由余分な書式で6 失敗理由タイムアウトで1

216/216

順位	モデル	企業	データ解析と抽出スコア	スコア	合計コスト	正解テスト	応答時間（平均）
#19	Muse Spark 1.1 medium	Meta	10.0	8.6	$1.357	2/2	4.96s
合計テスト数 2 誤答テスト数 0 合計コスト $1.357 応答時間（平均） 4.96s
#20	Claude Fable 5 medium	Anthropic	10.0	8.6	$3.478	2/2	7.18s
合計テスト数 2 誤答テスト数 0 合計コスト $3.478 応答時間（平均） 7.18s
#21	GPT-5.4 medium	OpenAI	10.0	8.5	$1.533	2/2	5.32s
合計テスト数 2 誤答テスト数 0 合計コスト $1.533 応答時間（平均） 5.32s
#22	Qwen3.6 Max Preview medium	Qwen	10.0	8.4	$1.143	2/2	41.2s
合計テスト数 2 誤答テスト数 0 合計コスト $1.143 応答時間（平均） 41.2s
#23	Grok 4.5 low	X AI	10.0	8.4	$0.935	2/2	3.44s
合計テスト数 2 誤答テスト数 0 合計コスト $0.935 応答時間（平均） 3.44s
#24	GPT-5.2 medium	OpenAI	10.0	8.4	$0.951	2/2	3.15s
合計テスト数 2 誤答テスト数 0 合計コスト $0.951 応答時間（平均） 3.15s
#25	Grok 4.5 medium	X AI	10.0	8.3	$1.928	2/2	6.29s
合計テスト数 2 誤答テスト数 0 合計コスト $1.928 応答時間（平均） 6.29s
#26	Claude Sonnet 5 medium	Anthropic	10.0	8.3	$0.922	2/2	3.16s
合計テスト数 2 誤答テスト数 0 合計コスト $0.922 応答時間（平均） 3.16s
#27	Muse Spark 1.1 low	Meta	10.0	8.3	$0.647	2/2	3.22s
合計テスト数 2 誤答テスト数 0 合計コスト $0.647 応答時間（平均） 3.22s
#28	Gemini 2.5 Flash medium	Google	10.0	8.2	$0.643	2/2	4.06s
合計テスト数 2 誤答テスト数 0 合計コスト $0.643 応答時間（平均） 4.06s
#29	GPT-5 Mini medium	OpenAI	10.0	8.1	$0.237	2/2	12.6s
合計テスト数 2 誤答テスト数 0 合計コスト $0.237 応答時間（平均） 12.6s
#30	Muse Spark 1.1 high	Meta	10.0	8.1	$1.694	2/2	8.40s
合計テスト数 2 誤答テスト数 0 合計コスト $1.694 応答時間（平均） 8.40s
#31	Gemini 3.5 Flash-Lite high	Google	10.0	8.1	$0.584	2/2	2.71s
合計テスト数 2 誤答テスト数 0 合計コスト $0.584 応答時間（平均） 2.71s
#32	Inkling high	Thinkingmachines	10.0	8.0	$1.006	2/2	8.19s
合計テスト数 2 誤答テスト数 0 合計コスト $1.006 応答時間（平均） 8.19s
#33	Step 3.7 Flash medium	Stepfun	10.0	8.0	$0.515	2/2	2.75s
合計テスト数 2 誤答テスト数 0 合計コスト $0.515 応答時間（平均） 2.75s

データ解析と抽出ランキング

モデルを絞り込む

データ解析と抽出スコア上位モデル

データ解析と抽出スコア vs 合計コスト

応答時間（平均）上位モデル

データ解析と抽出 ランキング

モデルを絞り込む

データ解析と抽出 スコア 上位モデル

データ解析と抽出 スコア vs 合計コスト

応答時間（平均） 上位モデル

データ解析と抽出ランキング

データ解析と抽出スコア上位モデル

データ解析と抽出スコア vs 合計コスト

応答時間（平均）上位モデル