Peringkat model Parsing dan ekstraksi data

Lihat model AI mana yang paling baik di Parsing dan ekstraksi data, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Tes benar ↑.

Model yang ditampilkan

Rata-rata Skor Parsing dan ekstraksi data

8.9

Model terbaik

LongCat 2.0 3.6

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah41 Dengan alasan kegagalan Kesalahan API14 Dengan alasan kegagalan Tidak ada jawaban8 Dengan alasan kegagalan Format tambahan6 Dengan alasan kegagalan Kedaluwarsa1

216/216

Peringkat	Model	Perusahaan	Skor Parsing dan ekstraksi data	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#125	Qwen3.5-35B-A3B medium	Qwen	7.3	6.2	$0.837	1/2	59.3s
Total Tes 2 Tes Salah 1 Total Biaya $0.837 Waktu respons (rata-rata) 59.3s
#127	gpt-oss-120b medium	OpenAI	6.4	6.1	$0.019	1/2	1.98s
Total Tes 2 Tes Salah 1 Total Biaya $0.019 Waktu respons (rata-rata) 1.98s
#141	Hy3 preview high	Tencent	6.5	5.9	$0.048	1/2	12.1s
Total Tes 2 Tes Salah 1 Total Biaya $0.048 Waktu respons (rata-rata) 12.1s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	6.5	5.6	$0.077	1/2	3.59s
Total Tes 2 Tes Salah 1 Total Biaya $0.077 Waktu respons (rata-rata) 3.59s
#155	KAT-Coder-Air V2.5 medium	Kwaipilot	6.5	5.6	$0.048	1/2	3.65s
Total Tes 2 Tes Salah 1 Total Biaya $0.048 Waktu respons (rata-rata) 3.65s
#158	Qwen3.6 27B none	Qwen	7.3	5.5	$0.087	1/2	2.06s
Total Tes 2 Tes Salah 1 Total Biaya $0.087 Waktu respons (rata-rata) 2.06s
#159	Hy3 preview low	Tencent	6.5	5.5	$0.015	1/2	5.85s
Total Tes 2 Tes Salah 1 Total Biaya $0.015 Waktu respons (rata-rata) 5.85s
#161	Kimi K2.5 none	Moonshot AI	7.3	5.5	$0.127	1/2	42.1s
Total Tes 2 Tes Salah 1 Total Biaya $0.127 Waktu respons (rata-rata) 42.1s
#164	KAT-Coder-Air V2.5 low	Kwaipilot	6.5	5.4	$0.041	1/2	2.82s
Total Tes 2 Tes Salah 1 Total Biaya $0.041 Waktu respons (rata-rata) 2.82s
#172	Qwen3 Coder Next none	Qwen	6.5	5.1	$0.025	1/2	1.32s
Total Tes 2 Tes Salah 1 Total Biaya $0.025 Waktu respons (rata-rata) 1.32s
#173	Mistral Small 4 medium	Mistral	7.3	5.1	$0.096	1/2	1.23s
Total Tes 2 Tes Salah 1 Total Biaya $0.096 Waktu respons (rata-rata) 1.23s
#174	MiMo-V2.5 none	Xiaomi	6.5	5.1	$0.025	1/2	1.01s
Total Tes 2 Tes Salah 1 Total Biaya $0.025 Waktu respons (rata-rata) 1.01s
#178	MiniMax M2.7 medium	Minimax	6.3	5.0	$0.163	1/2	21.9s
Total Tes 2 Tes Salah 1 Total Biaya $0.163 Waktu respons (rata-rata) 21.9s
#179	DeepSeek V3.2 none	DeepSeek	6.3	5.0	$0.054	1/2	9.42s
Total Tes 2 Tes Salah 1 Total Biaya $0.054 Waktu respons (rata-rata) 9.42s
#182	GLM 4.7 Flash none	Z.ai	7.3	4.9	$0.016	1/2	4.82s
Total Tes 2 Tes Salah 1 Total Biaya $0.016 Waktu respons (rata-rata) 4.82s

Peringkat Parsing dan ekstraksi data

Filter model

Model teratas menurut Skor Parsing dan ekstraksi data

Skor Parsing dan ekstraksi data vs total biaya

Model teratas menurut Waktu respons (rata-rata)