Peringkat Parsing dan ekstraksi data x Jawaban salah

Lihat model AI mana yang paling mungkin mengalami Jawaban salah di Parsing dan ekstraksi data, agar Anda bisa menemukan titik lemahnya lebih cepat.

Model yang ditampilkan

Total kegagalan

Model yang paling terdampak

GPT-5 Nano 2

Alasan kegagalan

Jawaban salah41 Kesalahan API14 Tidak ada jawaban8 Format tambahan6 Kedaluwarsa1

Kategori

Spesifik domain412 Trik anti-AI293 Pemrograman252 Pemecahan teka-teki201 Pengetahuan umum168 Gabungan68 Kepatuhan instruksi61 Kecerdasan umum59 Parsing dan ekstraksi data41 Pemanggilan alat3

36/36

Peringkat	Model	Perusahaan	Jumlah Jawaban salah	Skor kategori	Total Biaya	Tes benar	Waktu respons (rata-rata)
#109	Mimo V2 PRO medium	Xiaomi	1	7.3	$0.333	1/2	17.2s
Total Tes 2 Tes Salah 1 Total Biaya $0.333 Waktu respons (rata-rata) 17.2s
#121	gpt-oss-120b medium	OpenAI	1	6.4	$0.019	1/2	1.98s
Total Tes 2 Tes Salah 1 Total Biaya $0.019 Waktu respons (rata-rata) 1.98s
#144	KAT-Coder-Air V2.5 high	Kwaipilot	1	6.5	$0.077	1/2	3.59s
Total Tes 2 Tes Salah 1 Total Biaya $0.077 Waktu respons (rata-rata) 3.59s
#149	KAT-Coder-Air V2.5 medium	Kwaipilot	1	6.5	$0.048	1/2	3.65s
Total Tes 2 Tes Salah 1 Total Biaya $0.048 Waktu respons (rata-rata) 3.65s
#152	Qwen3.6 27B none	Qwen	1	7.3	$0.087	1/2	2.06s
Total Tes 2 Tes Salah 1 Total Biaya $0.087 Waktu respons (rata-rata) 2.06s
#155	Kimi K2.5 none	Moonshot AI	1	7.3	$0.127	1/2	42.1s
Total Tes 2 Tes Salah 1 Total Biaya $0.127 Waktu respons (rata-rata) 42.1s
#158	KAT-Coder-Air V2.5 low	Kwaipilot	1	6.5	$0.041	1/2	2.82s
Total Tes 2 Tes Salah 1 Total Biaya $0.041 Waktu respons (rata-rata) 2.82s
#166	Qwen3 Coder Next none	Qwen	1	6.5	$0.025	1/2	1.32s
Total Tes 2 Tes Salah 1 Total Biaya $0.025 Waktu respons (rata-rata) 1.32s
#172	MiniMax M2.7 medium	Minimax	1	6.3	$0.163	1/2	21.9s
Total Tes 2 Tes Salah 1 Total Biaya $0.163 Waktu respons (rata-rata) 21.9s
#173	DeepSeek V3.2 none	DeepSeek	1	6.3	$0.054	1/2	9.42s
Total Tes 2 Tes Salah 1 Total Biaya $0.054 Waktu respons (rata-rata) 9.42s
#176	GLM 4.7 Flash none	Z.ai	1	7.3	$0.016	1/2	4.82s
Total Tes 2 Tes Salah 1 Total Biaya $0.016 Waktu respons (rata-rata) 4.82s
#178	Ling-2.6-flash none	Inclusionai	1	6.5	$0.002	1/2	8.48s
Total Tes 2 Tes Salah 1 Total Biaya $0.002 Waktu respons (rata-rata) 8.48s
#179	Ring-2.6-1T none	Inclusionai	1	3.0	$0.026	0/2	45.9s
Total Tes 2 Tes Salah 2 Total Biaya $0.026 Waktu respons (rata-rata) 45.9s
#180	GPT-5.4 Nano none	OpenAI	1	6.5	$0.041	1/2	1.11s
Total Tes 2 Tes Salah 1 Total Biaya $0.041 Waktu respons (rata-rata) 1.11s
#187	Qwen3 Coder Next medium	Qwen	1	6.5	$0.032	1/2	81.8s
Total Tes 2 Tes Salah 1 Total Biaya $0.032 Waktu respons (rata-rata) 81.8s

Filter model

Model teratas menurut Jumlah Jawaban salah

Jumlah Jawaban salah vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang

Parsing dan ekstraksi data: Jawaban salah

Filter model

Model teratas menurut Jumlah Jawaban salah

Jumlah Jawaban salah vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang