データ解析と抽出モデルランキング

データ解析と抽出でどのAIモデルが最も強いか、どのモデルが安定しているか、差が大きいのはどこかを確認できます。並び替え: 指標 ↑.

表示モデル数

平均データ解析と抽出スコア

8.9

最良モデル

Step 3.5 Flash 1.5

失敗理由

失敗理由不正解で41 失敗理由 API エラーで14 失敗理由回答なしで8 失敗理由余分な書式で6 失敗理由タイムアウトで1

210/210

順位	モデル	企業	データ解析と抽出スコア	スコア	合計コスト	正解テスト	応答時間（平均）
#193	Elephant Alpha none	Openrouter	6.5	4.3	$0.000	1/2	1.04s
合計テスト数 2 誤答テスト数 1 合計コスト $0.000 応答時間（平均） 1.04s
#195	Elephant Alpha medium	Openrouter	6.5	4.3	$0.000	1/2	979ms
合計テスト数 2 誤答テスト数 1 合計コスト $0.000 応答時間（平均） 979ms
#79	Gemini 3.5 Flash none	Google	6.5	7.0	$1.079	1/2	8.10s
合計テスト数 2 誤答テスト数 1 合計コスト $1.079 応答時間（平均） 8.10s
#100	Hy3 preview medium	Tencent	6.5	6.5	$0.018	1/2	5.25s
合計テスト数 2 誤答テスト数 1 合計コスト $0.018 応答時間（平均） 5.25s
#113	MiMo-V2-Flash medium	Xiaomi	6.5	6.3	$0.043	1/2	0ms
合計テスト数 2 誤答テスト数 1 合計コスト $0.043 応答時間（平均） 0ms
#135	Hy3 preview high	Tencent	6.5	5.9	$0.048	1/2	12.1s
合計テスト数 2 誤答テスト数 1 合計コスト $0.048 応答時間（平均） 12.1s
#153	Hy3 preview low	Tencent	6.5	5.5	$0.015	1/2	5.85s
合計テスト数 2 誤答テスト数 1 合計コスト $0.015 応答時間（平均） 5.85s
#168	MiMo-V2.5 none	Xiaomi	6.5	5.1	$0.025	1/2	1.01s
合計テスト数 2 誤答テスト数 1 合計コスト $0.025 応答時間（平均） 1.01s
#199	Hy3 preview none	Tencent	6.5	4.0	$0.003	1/2	2.85s
合計テスト数 2 誤答テスト数 1 合計コスト $0.003 応答時間（平均） 2.85s
#206	gpt-oss-120b none	OpenAI	6.5	3.7	$0.010	1/2	7.12s
合計テスト数 2 誤答テスト数 1 合計コスト $0.010 応答時間（平均） 7.12s
#14	Claude Opus 4.8 medium	Anthropic	7.1	8.8	$1.931	1/2	12.3s
合計テスト数 2 誤答テスト数 1 合計コスト $1.931 応答時間（平均） 12.3s
#42	GLM 5 medium	Z.ai	7.1	7.7	$0.307	1/2	8.90s
合計テスト数 2 誤答テスト数 1 合計コスト $0.307 応答時間（平均） 8.90s
#198	Laguna Xs.2 medium	Poolside	7.1	4.1	$0.015	1/2	9.34s
合計テスト数 2 誤答テスト数 1 合計コスト $0.015 応答時間（平均） 9.34s
#33	Kimi K3 max	Moonshot AI	7.3	8.0	$3.112	1/2	16.7s
合計テスト数 2 誤答テスト数 1 合計コスト $3.112 応答時間（平均） 16.7s
#66	Claude Opus 4.8 none	Anthropic	7.3	7.3	$1.166	1/2	1.77s
合計テスト数 2 誤答テスト数 1 合計コスト $1.166 応答時間（平均） 1.77s

データ解析と抽出ランキング

モデルを絞り込む

データ解析と抽出スコア上位モデル

データ解析と抽出スコア vs 合計コスト

応答時間（平均）上位モデル

データ解析と抽出 ランキング

モデルを絞り込む

データ解析と抽出 スコア 上位モデル

データ解析と抽出 スコア vs 合計コスト

応答時間（平均） 上位モデル

データ解析と抽出ランキング

データ解析と抽出スコア上位モデル

データ解析と抽出スコア vs 合計コスト

応答時間（平均）上位モデル