データ解析と抽出モデルランキング

データ解析と抽出でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。並び替え: 応答時間（平均） ↓.

表示モデル数

平均データ解析と抽出スコア

8.9

最良モデル

Qwen3.5-9B 3.6

失敗理由

失敗理由不正解で41 失敗理由 API エラーで14 失敗理由回答なしで8 失敗理由余分な書式で6 失敗理由タイムアウトで1

216/216

順位	モデル	企業	データ解析と抽出スコア	スコア	合計コスト	正解テスト	応答時間（平均）
#28	Gemini 2.5 Flash medium	Google	10.0	8.2	$0.643	2/2	4.06s
合計テスト数 2 誤答テスト数 0 合計コスト $0.643 応答時間（平均） 4.06s
#137	Grok 4.20 Beta medium	X AI	10.0	6.0	$0.750	2/2	4.01s
合計テスト数 2 誤答テスト数 0 合計コスト $0.750 応答時間（平均） 4.01s
#151	GLM 5V Turbo none	Z.ai	10.0	5.6	$0.052	2/2	3.81s
合計テスト数 2 誤答テスト数 0 合計コスト $0.052 応答時間（平均） 3.81s
#155	KAT-Coder-Air V2.5 medium	Kwaipilot	6.5	5.6	$0.048	1/2	3.65s
合計テスト数 2 誤答テスト数 1 合計コスト $0.048 応答時間（平均） 3.65s
#36	Inkling medium	Thinkingmachines	10.0	8.0	$0.391	2/2	3.60s
合計テスト数 2 誤答テスト数 0 合計コスト $0.391 応答時間（平均） 3.60s
#154	Owl Alpha none	Openrouter	10.0	5.6	$0.000	2/2	3.60s
合計テスト数 2 誤答テスト数 0 合計コスト $0.000 応答時間（平均） 3.60s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	6.5	5.6	$0.077	1/2	3.59s
合計テスト数 2 誤答テスト数 1 合計コスト $0.077 応答時間（平均） 3.59s
#23	Grok 4.5 low	X AI	10.0	8.4	$0.935	2/2	3.44s
合計テスト数 2 誤答テスト数 0 合計コスト $0.935 応答時間（平均） 3.44s
#67	Claude Sonnet 4.6 none	Anthropic	10.0	7.3	$0.661	2/2	3.43s
合計テスト数 2 誤答テスト数 0 合計コスト $0.661 応答時間（平均） 3.43s
#198	Laguna M.1 none	Poolside	10.0	4.4	$0.009	2/2	3.37s
合計テスト数 2 誤答テスト数 0 合計コスト $0.009 応答時間（平均） 3.37s
#9	GPT-5.5 low	OpenAI	10.0	9.3	$1.253	2/2	3.28s
合計テスト数 2 誤答テスト数 0 合計コスト $1.253 応答時間（平均） 3.28s
#189	Trinity Large Preview none	Arcee AI	10.0	4.8	$0.008	2/2	3.26s
合計テスト数 2 誤答テスト数 0 合計コスト $0.008 応答時間（平均） 3.26s
#27	Muse Spark 1.1 low	Meta	10.0	8.3	$0.647	2/2	3.22s
合計テスト数 2 誤答テスト数 0 合計コスト $0.647 応答時間（平均） 3.22s
#26	Claude Sonnet 5 medium	Anthropic	10.0	8.3	$0.922	2/2	3.16s
合計テスト数 2 誤答テスト数 0 合計コスト $0.922 応答時間（平均） 3.16s
#24	GPT-5.2 medium	OpenAI	10.0	8.4	$0.951	2/2	3.15s
合計テスト数 2 誤答テスト数 0 合計コスト $0.951 応答時間（平均） 3.15s

データ解析と抽出ランキング

モデルを絞り込む

データ解析と抽出スコア上位モデル

データ解析と抽出スコア vs 合計コスト

応答時間（平均）上位モデル

データ解析と抽出 ランキング

モデルを絞り込む

データ解析と抽出 スコア 上位モデル

データ解析と抽出 スコア vs 合計コスト

応答時間（平均） 上位モデル

データ解析と抽出ランキング

データ解析と抽出スコア上位モデル

データ解析と抽出スコア vs 合計コスト

応答時間（平均）上位モデル