Peringkat model Parsing dan ekstraksi data

Lihat model AI mana yang paling baik di Parsing dan ekstraksi data, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Tes benar ↑.

Model yang ditampilkan

Rata-rata Skor Parsing dan ekstraksi data

8.9

Model terbaik

LongCat 2.0 3.6

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah41 Dengan alasan kegagalan Kesalahan API14 Dengan alasan kegagalan Tidak ada jawaban8 Dengan alasan kegagalan Format tambahan6 Dengan alasan kegagalan Kedaluwarsa1

210/210

Peringkat	Model	Perusahaan	Skor Parsing dan ekstraksi data	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#41	Claude Opus 4.8 low	Anthropic	6.3	7.8	$2.077	1/2	2.27s
Total Tes 2 Tes Salah 1 Total Biaya $2.077 Waktu respons (rata-rata) 2.27s
#42	GLM 5 medium	Z.ai	7.1	7.7	$0.307	1/2	8.90s
Total Tes 2 Tes Salah 1 Total Biaya $0.307 Waktu respons (rata-rata) 8.90s
#60	LongCat 2.0 medium	Meituan	6.3	7.4	$0.478	1/2	10.6s
Total Tes 2 Tes Salah 1 Total Biaya $0.478 Waktu respons (rata-rata) 10.6s
#66	Claude Opus 4.8 none	Anthropic	7.3	7.3	$1.166	1/2	1.77s
Total Tes 2 Tes Salah 1 Total Biaya $1.166 Waktu respons (rata-rata) 1.77s
#67	Step 3.7 Flash low	Stepfun	7.3	7.3	$0.454	1/2	2.29s
Total Tes 2 Tes Salah 1 Total Biaya $0.454 Waktu respons (rata-rata) 2.29s
#78	Mercury 2 medium	Inception	7.3	7.0	$0.093	1/2	1.11s
Total Tes 2 Tes Salah 1 Total Biaya $0.093 Waktu respons (rata-rata) 1.11s
#79	Gemini 3.5 Flash none	Google	6.5	7.0	$1.079	1/2	8.10s
Total Tes 2 Tes Salah 1 Total Biaya $1.079 Waktu respons (rata-rata) 8.10s
#81	KAT-Coder-Pro V2.5 medium	Kwaipilot	7.3	6.9	$0.467	1/2	4.70s
Total Tes 2 Tes Salah 1 Total Biaya $0.467 Waktu respons (rata-rata) 4.70s
#84	MiMo-V2.5-Pro medium	Xiaomi	7.3	6.9	$0.187	1/2	18.8s
Total Tes 2 Tes Salah 1 Total Biaya $0.187 Waktu respons (rata-rata) 18.8s
#91	LongCat 2.0 low	Meituan	6.3	6.7	$0.391	1/2	10.8s
Total Tes 2 Tes Salah 1 Total Biaya $0.391 Waktu respons (rata-rata) 10.8s
#100	Hy3 preview medium	Tencent	6.5	6.5	$0.018	1/2	5.25s
Total Tes 2 Tes Salah 1 Total Biaya $0.018 Waktu respons (rata-rata) 5.25s
#108	Ring-2.6-1T medium	Inclusionai	6.5	6.3	$0.103	1/2	37.4s
Total Tes 2 Tes Salah 1 Total Biaya $0.103 Waktu respons (rata-rata) 37.4s
#109	Mimo V2 PRO medium	Xiaomi	7.3	6.3	$0.333	1/2	17.2s
Total Tes 2 Tes Salah 1 Total Biaya $0.333 Waktu respons (rata-rata) 17.2s
#113	MiMo-V2-Flash medium	Xiaomi	6.5	6.3	$0.043	1/2	0ms
Total Tes 2 Tes Salah 1 Total Biaya $0.043 Waktu respons (rata-rata) 0ms
#114	Qwen3.5-Flash medium	Qwen	7.3	6.2	$0.139	1/2	57.0s
Total Tes 2 Tes Salah 1 Total Biaya $0.139 Waktu respons (rata-rata) 57.0s

Peringkat Parsing dan ekstraksi data

Filter model

Model teratas menurut Skor Parsing dan ekstraksi data

Skor Parsing dan ekstraksi data vs total biaya

Model teratas menurut Waktu respons (rata-rata)