Peringkat model Parsing dan ekstraksi data

Lihat model AI mana yang paling baik di Parsing dan ekstraksi data, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Tes benar ↑.

Model yang ditampilkan

Rata-rata Skor Parsing dan ekstraksi data

8.9

Model terbaik

LongCat 2.0 3.6

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah41 Dengan alasan kegagalan Kesalahan API14 Dengan alasan kegagalan Tidak ada jawaban8 Dengan alasan kegagalan Format tambahan6 Dengan alasan kegagalan Kedaluwarsa1

210/210

Peringkat	Model	Perusahaan	Skor Parsing dan ekstraksi data	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#97	LongCat 2.0 high	Meituan	3.6	6.6	$0.469	0/2	11.0s
Total Tes 2 Tes Salah 2 Total Biaya $0.469 Waktu respons (rata-rata) 11.0s
#99	Qwen3.6 27B medium	Qwen	3.5	6.5	$0.779	0/2	37.3s
Total Tes 2 Tes Salah 2 Total Biaya $0.779 Waktu respons (rata-rata) 37.3s
#101	MiMo-V2.5 medium	Xiaomi	2.7	6.5	$0.082	0/2	6.33s
Total Tes 2 Tes Salah 2 Total Biaya $0.082 Waktu respons (rata-rata) 6.33s
#128	GPT-5 Nano medium	OpenAI	3.7	6.1	$0.114	0/2	21.4s
Total Tes 2 Tes Salah 2 Total Biaya $0.114 Waktu respons (rata-rata) 21.4s
#179	Ring-2.6-1T none	Inclusionai	3.0	4.8	$0.026	0/2	45.9s
Total Tes 2 Tes Salah 2 Total Biaya $0.026 Waktu respons (rata-rata) 45.9s
#190	MiniMax M2.5 medium	Minimax	4.6	4.6	$0.340	0/2	7.48s
Total Tes 2 Tes Salah 2 Total Biaya $0.340 Waktu respons (rata-rata) 7.48s
#200	MiMo-V2-Flash none	Xiaomi	2.9	4.0	$0.025	0/2	19.7s
Total Tes 2 Tes Salah 2 Total Biaya $0.025 Waktu respons (rata-rata) 19.7s
#201	Granite 4.1 8B none	IBM Granite	3.0	4.0	$0.007	0/2	575ms
Total Tes 2 Tes Salah 2 Total Biaya $0.007 Waktu respons (rata-rata) 575ms
#202	Grok Build 0.1 none	X AI	3.8	4.0	$0.547	0/2	9.33s
Total Tes 2 Tes Salah 2 Total Biaya $0.547 Waktu respons (rata-rata) 9.33s
#204	Qwen3.5-9B medium	Qwen	3.6	3.8	$0.036	0/2	87.3s
Total Tes 2 Tes Salah 2 Total Biaya $0.036 Waktu respons (rata-rata) 87.3s
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.8	3.2	$0.000	0/2	1.42s
Total Tes 2 Tes Salah 2 Total Biaya $0.000 Waktu respons (rata-rata) 1.42s
#209	Step 3.5 Flash none	Stepfun	1.5	2.3	$0.020	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $0.020 Waktu respons (rata-rata) 0ms
#210	LFM2-24B-A2B none	Liquid	3.0	2.2	$0.001	0/2	714ms
Total Tes 2 Tes Salah 2 Total Biaya $0.001 Waktu respons (rata-rata) 714ms
#14	Claude Opus 4.8 medium	Anthropic	7.1	8.8	$1.931	1/2	12.3s
Total Tes 2 Tes Salah 1 Total Biaya $1.931 Waktu respons (rata-rata) 12.3s
#33	Kimi K3 max	Moonshot AI	7.3	8.0	$3.112	1/2	16.7s
Total Tes 2 Tes Salah 1 Total Biaya $3.112 Waktu respons (rata-rata) 16.7s

Peringkat Parsing dan ekstraksi data

Filter model

Model teratas menurut Skor Parsing dan ekstraksi data

Skor Parsing dan ekstraksi data vs total biaya

Model teratas menurut Waktu respons (rata-rata)