Peringkat model Parsing dan ekstraksi data

Lihat model AI mana yang paling baik di Parsing dan ekstraksi data, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Tes benar ↓.

Model yang ditampilkan

Rata-rata Skor Parsing dan ekstraksi data

8.9

Model terbaik

Gemini 3.6 Flash 10.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah41 Dengan alasan kegagalan Kesalahan API14 Dengan alasan kegagalan Tidak ada jawaban8 Dengan alasan kegagalan Format tambahan6 Dengan alasan kegagalan Kedaluwarsa1

216/216

Peringkat	Model	Perusahaan	Skor Parsing dan ekstraksi data	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#191	Grok 4.1 Fast medium	X AI	10.0	4.7	$0.069	2/2	6.63s
Total Tes 2 Tes Salah 0 Total Biaya $0.069 Waktu respons (rata-rata) 6.63s
#192	Laguna M.1 medium	Poolside	10.0	4.7	$0.033	2/2	4.93s
Total Tes 2 Tes Salah 0 Total Biaya $0.033 Waktu respons (rata-rata) 4.93s
#197	Grok 4.20 Beta none	X AI	10.0	4.4	$0.087	2/2	601ms
Total Tes 2 Tes Salah 0 Total Biaya $0.087 Waktu respons (rata-rata) 601ms
#198	Laguna M.1 none	Poolside	10.0	4.4	$0.009	2/2	3.37s
Total Tes 2 Tes Salah 0 Total Biaya $0.009 Waktu respons (rata-rata) 3.37s
#202	Hunter Alpha none	OpenRouter	10.0	4.2	$0.000	2/2	8.49s
Total Tes 2 Tes Salah 0 Total Biaya $0.000 Waktu respons (rata-rata) 8.49s
#203	Grok 4.20 none	X AI	10.0	4.1	$0.057	2/2	522ms
Total Tes 2 Tes Salah 0 Total Biaya $0.057 Waktu respons (rata-rata) 522ms
#209	Grok 4.1 Fast none	X AI	10.0	3.8	$0.008	2/2	943ms
Total Tes 2 Tes Salah 0 Total Biaya $0.008 Waktu respons (rata-rata) 943ms
#211	Laguna Xs.2 none	Poolside	10.0	3.8	$0.004	2/2	646ms
Total Tes 2 Tes Salah 0 Total Biaya $0.004 Waktu respons (rata-rata) 646ms
#17	Claude Opus 4.8 medium	Anthropic	7.1	8.8	$1.931	1/2	12.3s
Total Tes 2 Tes Salah 1 Total Biaya $1.931 Waktu respons (rata-rata) 12.3s
#37	Kimi K3 max	Moonshot AI	7.3	8.0	$3.112	1/2	16.7s
Total Tes 2 Tes Salah 1 Total Biaya $3.112 Waktu respons (rata-rata) 16.7s
#45	Claude Opus 4.8 low	Anthropic	6.3	7.8	$2.077	1/2	2.27s
Total Tes 2 Tes Salah 1 Total Biaya $2.077 Waktu respons (rata-rata) 2.27s
#46	GLM 5 medium	Z.ai	7.1	7.7	$0.307	1/2	8.90s
Total Tes 2 Tes Salah 1 Total Biaya $0.307 Waktu respons (rata-rata) 8.90s
#64	LongCat 2.0 medium	Meituan	6.3	7.4	$0.478	1/2	10.6s
Total Tes 2 Tes Salah 1 Total Biaya $0.478 Waktu respons (rata-rata) 10.6s
#70	Claude Opus 4.8 none	Anthropic	7.3	7.3	$1.166	1/2	1.77s
Total Tes 2 Tes Salah 1 Total Biaya $1.166 Waktu respons (rata-rata) 1.77s
#71	Step 3.7 Flash low	Stepfun	7.3	7.3	$0.454	1/2	2.29s
Total Tes 2 Tes Salah 1 Total Biaya $0.454 Waktu respons (rata-rata) 2.29s

Peringkat Parsing dan ekstraksi data

Filter model

Model teratas menurut Skor Parsing dan ekstraksi data

Skor Parsing dan ekstraksi data vs total biaya

Model teratas menurut Waktu respons (rata-rata)