Peringkat Parsing dan ekstraksi data x Format tambahan

Lihat model AI mana yang paling mungkin mengalami Format tambahan di Parsing dan ekstraksi data, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Waktu respons (rata-rata) ↓.

Model yang ditampilkan

Total kegagalan

Model yang paling terdampak

Qwen3.5-9B 1

Alasan kegagalan

Jawaban salah41 Kesalahan API14 Tidak ada jawaban8 Format tambahan6 Kedaluwarsa1

Kategori

Trik anti-AI20 Pemrograman18 Spesifik domain17 Pemecahan teka-teki8 Parsing dan ekstraksi data6 Kepatuhan instruksi3 Gabungan1

6/6

Peringkat	Model	Perusahaan	Jumlah Format tambahan	Skor kategori	Total Biaya	Tes benar	Waktu respons (rata-rata)
#204	Qwen3.5-9B medium	Qwen	1	3.6	$0.036	0/2	87.3s
Total Tes 2 Tes Salah 2 Total Biaya $0.036 Waktu respons (rata-rata) 87.3s
#200	MiMo-V2-Flash none	Xiaomi	1	2.9	$0.025	0/2	19.7s
Total Tes 2 Tes Salah 2 Total Biaya $0.025 Waktu respons (rata-rata) 19.7s
#33	Kimi K3 max	Moonshot AI	1	7.3	$3.112	1/2	16.7s
Total Tes 2 Tes Salah 1 Total Biaya $3.112 Waktu respons (rata-rata) 16.7s
#101	MiMo-V2.5 medium	Xiaomi	1	2.7	$0.082	0/2	6.33s
Total Tes 2 Tes Salah 2 Total Biaya $0.082 Waktu respons (rata-rata) 6.33s
#182	KAT-Coder-Air V2.5 none	Kwaipilot	1	6.3	$0.067	1/2	2.66s
Total Tes 2 Tes Salah 1 Total Biaya $0.067 Waktu respons (rata-rata) 2.66s
#168	MiMo-V2.5 none	Xiaomi	1	6.5	$0.025	1/2	1.01s
Total Tes 2 Tes Salah 1 Total Biaya $0.025 Waktu respons (rata-rata) 1.01s

Filter model

Model teratas menurut Jumlah Format tambahan

Jumlah Format tambahan vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang

Parsing dan ekstraksi data: Format tambahan

Filter model

Model teratas menurut Jumlah Format tambahan

Jumlah Format tambahan vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang