Peringkat model Parsing dan ekstraksi data

Lihat model AI mana yang paling baik di Parsing dan ekstraksi data, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Tes benar ↓.

Model yang ditampilkan

Rata-rata Skor Parsing dan ekstraksi data

8.9

Model terbaik

Gemini 3.6 Flash 10.0

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah41 Dengan alasan kegagalan Kesalahan API14 Dengan alasan kegagalan Tidak ada jawaban8 Dengan alasan kegagalan Format tambahan6 Dengan alasan kegagalan Kedaluwarsa1

216/216

Peringkat	Model	Perusahaan	Skor Parsing dan ekstraksi data	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#86	DeepSeek V4 Pro none	DeepSeek	10.0	6.9	$0.096	2/2	4.61s
Total Tes 2 Tes Salah 0 Total Biaya $0.096 Waktu respons (rata-rata) 4.61s
#87	GPT-5.6 Sol none	OpenAI	10.0	6.9	$0.524	2/2	1.53s
Total Tes 2 Tes Salah 0 Total Biaya $0.524 Waktu respons (rata-rata) 1.53s
#89	Qwen3.6 Flash medium	Qwen	10.0	6.9	$0.738	2/2	9.65s
Total Tes 2 Tes Salah 0 Total Biaya $0.738 Waktu respons (rata-rata) 9.65s
#90	Step 3.7 Flash high	Stepfun	10.0	6.9	$1.207	2/2	14.7s
Total Tes 2 Tes Salah 0 Total Biaya $1.207 Waktu respons (rata-rata) 14.7s
#91	GPT-5.5 none	OpenAI	10.0	6.9	$0.544	2/2	1.18s
Total Tes 2 Tes Salah 0 Total Biaya $0.544 Waktu respons (rata-rata) 1.18s
#92	Gemini 3.5 Flash minimal	Google	10.0	6.8	$0.300	2/2	1.66s
Total Tes 2 Tes Salah 0 Total Biaya $0.300 Waktu respons (rata-rata) 1.66s
#93	Gemini 3 Flash Preview none	Google	10.0	6.8	$0.085	2/2	1.41s
Total Tes 2 Tes Salah 0 Total Biaya $0.085 Waktu respons (rata-rata) 1.41s
#94	Qwen3.6 35B A3B medium	Qwen	10.0	6.7	$0.746	2/2	13.0s
Total Tes 2 Tes Salah 0 Total Biaya $0.746 Waktu respons (rata-rata) 13.0s
#95	Gemini 3.5 Flash-Lite low	Google	10.0	6.7	$0.145	2/2	657ms
Total Tes 2 Tes Salah 0 Total Biaya $0.145 Waktu respons (rata-rata) 657ms
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	10.0	6.7	$0.476	2/2	5.07s
Total Tes 2 Tes Salah 0 Total Biaya $0.476 Waktu respons (rata-rata) 5.07s
#98	GLM 5V Turbo medium	Z.ai	10.0	6.7	$0.457	2/2	9.60s
Total Tes 2 Tes Salah 0 Total Biaya $0.457 Waktu respons (rata-rata) 9.60s
#99	Claude Opus 4.7 none	Anthropic	10.0	6.6	$0.505	2/2	2.15s
Total Tes 2 Tes Salah 0 Total Biaya $0.505 Waktu respons (rata-rata) 2.15s
#100	Gemma 4 26B A4B medium	Google	10.0	6.6	$0.089	2/2	16.5s
Total Tes 2 Tes Salah 0 Total Biaya $0.089 Waktu respons (rata-rata) 16.5s
#101	GLM 5.2 none	Z.ai	10.0	6.6	$0.128	2/2	7.17s
Total Tes 2 Tes Salah 0 Total Biaya $0.128 Waktu respons (rata-rata) 7.17s
#103	Qwen3.6 Max Preview none	Qwen	10.0	6.6	$0.231	2/2	2.87s
Total Tes 2 Tes Salah 0 Total Biaya $0.231 Waktu respons (rata-rata) 2.87s

Peringkat Parsing dan ekstraksi data

Filter model

Model teratas menurut Skor Parsing dan ekstraksi data

Skor Parsing dan ekstraksi data vs total biaya

Model teratas menurut Waktu respons (rata-rata)