Peringkat model Parsing dan ekstraksi data

Lihat model AI mana yang paling baik di Parsing dan ekstraksi data, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Metrik ↑.

Model yang ditampilkan

Rata-rata Skor Parsing dan ekstraksi data

8.9

Model terbaik

Step 3.5 Flash 1.5

Alasan kegagalan

Dengan alasan kegagalan Jawaban salah41 Dengan alasan kegagalan Kesalahan API14 Dengan alasan kegagalan Tidak ada jawaban8 Dengan alasan kegagalan Format tambahan6 Dengan alasan kegagalan Kedaluwarsa1

216/216

Peringkat	Model	Perusahaan	Skor Parsing dan ekstraksi data	Skor	Total Biaya	Tes benar	Waktu respons (rata-rata)
#90	Step 3.7 Flash high	Stepfun	10.0	6.9	$1.207	2/2	14.7s
Total Tes 2 Tes Salah 0 Total Biaya $1.207 Waktu respons (rata-rata) 14.7s
#91	GPT-5.5 none	OpenAI	10.0	6.9	$0.544	2/2	1.18s
Total Tes 2 Tes Salah 0 Total Biaya $0.544 Waktu respons (rata-rata) 1.18s
#92	Gemini 3.5 Flash minimal	Google	10.0	6.8	$0.300	2/2	1.66s
Total Tes 2 Tes Salah 0 Total Biaya $0.300 Waktu respons (rata-rata) 1.66s
#93	Gemini 3 Flash Preview none	Google	10.0	6.8	$0.085	2/2	1.41s
Total Tes 2 Tes Salah 0 Total Biaya $0.085 Waktu respons (rata-rata) 1.41s
#94	Qwen3.6 35B A3B medium	Qwen	10.0	6.7	$0.746	2/2	13.0s
Total Tes 2 Tes Salah 0 Total Biaya $0.746 Waktu respons (rata-rata) 13.0s
#95	Gemini 3.5 Flash-Lite low	Google	10.0	6.7	$0.145	2/2	657ms
Total Tes 2 Tes Salah 0 Total Biaya $0.145 Waktu respons (rata-rata) 657ms
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	10.0	6.7	$0.476	2/2	5.07s
Total Tes 2 Tes Salah 0 Total Biaya $0.476 Waktu respons (rata-rata) 5.07s
#98	GLM 5V Turbo medium	Z.ai	10.0	6.7	$0.457	2/2	9.60s
Total Tes 2 Tes Salah 0 Total Biaya $0.457 Waktu respons (rata-rata) 9.60s
#99	Claude Opus 4.7 none	Anthropic	10.0	6.6	$0.505	2/2	2.15s
Total Tes 2 Tes Salah 0 Total Biaya $0.505 Waktu respons (rata-rata) 2.15s
#100	Gemma 4 26B A4B medium	Google	10.0	6.6	$0.089	2/2	16.5s
Total Tes 2 Tes Salah 0 Total Biaya $0.089 Waktu respons (rata-rata) 16.5s
#101	GLM 5.2 none	Z.ai	10.0	6.6	$0.128	2/2	7.17s
Total Tes 2 Tes Salah 0 Total Biaya $0.128 Waktu respons (rata-rata) 7.17s
#103	Qwen3.6 Max Preview none	Qwen	10.0	6.6	$0.231	2/2	2.87s
Total Tes 2 Tes Salah 0 Total Biaya $0.231 Waktu respons (rata-rata) 2.87s
#104	Gemini 3.5 Flash-Lite medium	Google	10.0	6.5	$0.369	2/2	1.69s
Total Tes 2 Tes Salah 0 Total Biaya $0.369 Waktu respons (rata-rata) 1.69s
#108	Laguna XS 2.1 medium	Poolside	10.0	6.5	$0.068	2/2	4.50s
Total Tes 2 Tes Salah 0 Total Biaya $0.068 Waktu respons (rata-rata) 4.50s
#109	Qwen3.5-27B none	Qwen	10.0	6.5	$0.090	2/2	1.43s
Total Tes 2 Tes Salah 0 Total Biaya $0.090 Waktu respons (rata-rata) 1.43s

←

1 9 10 11 15

→

Peringkat Parsing dan ekstraksi data

Filter model

Model teratas menurut Skor Parsing dan ekstraksi data

Skor Parsing dan ekstraksi data vs total biaya

Model teratas menurut Waktu respons (rata-rata)