Peringkat model Parsing dan ekstraksi data

Lihat model AI mana yang paling baik di Parsing dan ekstraksi data, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Metrik ↑.

Model yang ditampilkan

Rata-rata Skor Parsing dan ekstraksi data

8.9

Model terbaik

Step 3.5 Flash 1.5

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah41 Dengan alasan kegagalan Kesalahan API14 Dengan alasan kegagalan Tidak ada jawaban8 Dengan alasan kegagalan Format tambahan6 Dengan alasan kegagalan Kedaluwarsa1

216/216

Peringkat	Model	Perusahaan	Skor Parsing dan ekstraksi data	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#71	Step 3.7 Flash low	Stepfun	7.3	7.3	$0.454	1/2	2.29s
Total Tes 2 Tes Salah 1 Total Biaya $0.454 Waktu respons (rata-rata) 2.29s
#88	MiMo-V2.5-Pro medium	Xiaomi	7.3	6.9	$0.187	1/2	18.8s
Total Tes 2 Tes Salah 1 Total Biaya $0.187 Waktu respons (rata-rata) 18.8s
#115	Mimo V2 PRO medium	Xiaomi	7.3	6.3	$0.333	1/2	17.2s
Total Tes 2 Tes Salah 1 Total Biaya $0.333 Waktu respons (rata-rata) 17.2s
#158	Qwen3.6 27B none	Qwen	7.3	5.5	$0.087	1/2	2.06s
Total Tes 2 Tes Salah 1 Total Biaya $0.087 Waktu respons (rata-rata) 2.06s
#161	Kimi K2.5 none	Moonshot AI	7.3	5.5	$0.127	1/2	42.1s
Total Tes 2 Tes Salah 1 Total Biaya $0.127 Waktu respons (rata-rata) 42.1s
#182	GLM 4.7 Flash none	Z.ai	7.3	4.9	$0.016	1/2	4.82s
Total Tes 2 Tes Salah 1 Total Biaya $0.016 Waktu respons (rata-rata) 4.82s
#82	Mercury 2 medium	Inception	7.3	7.0	$0.093	1/2	1.11s
Total Tes 2 Tes Salah 1 Total Biaya $0.093 Waktu respons (rata-rata) 1.11s
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	7.3	6.9	$0.467	1/2	4.70s
Total Tes 2 Tes Salah 1 Total Biaya $0.467 Waktu respons (rata-rata) 4.70s
#120	Qwen3.5-Flash medium	Qwen	7.3	6.2	$0.139	1/2	57.0s
Total Tes 2 Tes Salah 1 Total Biaya $0.139 Waktu respons (rata-rata) 57.0s
#125	Qwen3.5-35B-A3B medium	Qwen	7.3	6.2	$0.837	1/2	59.3s
Total Tes 2 Tes Salah 1 Total Biaya $0.837 Waktu respons (rata-rata) 59.3s
#173	Mistral Small 4 medium	Mistral	7.3	5.1	$0.096	1/2	1.23s
Total Tes 2 Tes Salah 1 Total Biaya $0.096 Waktu respons (rata-rata) 1.23s
#195	Mercury 2 none	Inception	7.3	4.6	$0.030	1/2	667ms
Total Tes 2 Tes Salah 1 Total Biaya $0.030 Waktu respons (rata-rata) 667ms
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	7.3	3.4	$0.000	1/2	2.72s
Total Tes 2 Tes Salah 1 Total Biaya $0.000 Waktu respons (rata-rata) 2.72s
#1	Gemini 3.6 Flash medium	Google	10.0	9.9	$0.831	2/2	4.26s
Total Tes 2 Tes Salah 0 Total Biaya $0.831 Waktu respons (rata-rata) 4.26s
#2	Gemini 3.6 Flash high	Google	10.0	9.7	$1.785	2/2	5.20s
Total Tes 2 Tes Salah 0 Total Biaya $1.785 Waktu respons (rata-rata) 5.20s

Peringkat Parsing dan ekstraksi data

Filter model

Model teratas menurut Skor Parsing dan ekstraksi data

Skor Parsing dan ekstraksi data vs total biaya

Model teratas menurut Waktu respons (rata-rata)