Peringkat Parsing dan ekstraksi data x Kesalahan API

Lihat model AI mana yang paling mungkin mengalami Kesalahan API di Parsing dan ekstraksi data, agar Anda bisa menemukan titik lemahnya lebih cepat.

Model yang ditampilkan

Total kegagalan

Model yang paling terdampak

Gemini 3.5 Flash 1

Alasan kegagalan

Jawaban salah41 Kesalahan API14 Tidak ada jawaban8 Format tambahan6 Kedaluwarsa1

Kategori

Pemrograman45 Gabungan26 Pemanggilan alat17 Parsing dan ekstraksi data14 Trik anti-AI14 Pengetahuan umum13 Kecerdasan umum12 Pemecahan teka-teki12 Spesifik domain7 Kepatuhan instruksi1

14/14

Peringkat	Model	Perusahaan	Jumlah Kesalahan API	Skor kategori	Total Biaya	Tes benar	Waktu respons (rata-rata)
#79	Gemini 3.5 Flash none	Google	1	6.5	$1.079	1/2	8.10s
Total Tes 2 Tes Salah 1 Total Biaya $1.079 Waktu respons (rata-rata) 8.10s
#100	Hy3 preview medium	Tencent	1	6.5	$0.018	1/2	5.25s
Total Tes 2 Tes Salah 1 Total Biaya $0.018 Waktu respons (rata-rata) 5.25s
#113	MiMo-V2-Flash medium	Xiaomi	1	6.5	$0.043	1/2	0ms
Total Tes 2 Tes Salah 1 Total Biaya $0.043 Waktu respons (rata-rata) 0ms
#114	Qwen3.5-Flash medium	Qwen	1	7.3	$0.139	1/2	57.0s
Total Tes 2 Tes Salah 1 Total Biaya $0.139 Waktu respons (rata-rata) 57.0s
#119	Qwen3.5-35B-A3B medium	Qwen	1	7.3	$0.837	1/2	59.3s
Total Tes 2 Tes Salah 1 Total Biaya $0.837 Waktu respons (rata-rata) 59.3s
#135	Hy3 preview high	Tencent	1	6.5	$0.048	1/2	12.1s
Total Tes 2 Tes Salah 1 Total Biaya $0.048 Waktu respons (rata-rata) 12.1s
#153	Hy3 preview low	Tencent	1	6.5	$0.015	1/2	5.85s
Total Tes 2 Tes Salah 1 Total Biaya $0.015 Waktu respons (rata-rata) 5.85s
#167	Mistral Small 4 medium	Mistral	1	7.3	$0.096	1/2	1.23s
Total Tes 2 Tes Salah 1 Total Biaya $0.096 Waktu respons (rata-rata) 1.23s
#179	Ring-2.6-1T none	Inclusionai	1	3.0	$0.026	0/2	45.9s
Total Tes 2 Tes Salah 2 Total Biaya $0.026 Waktu respons (rata-rata) 45.9s
#199	Hy3 preview none	Tencent	1	6.5	$0.003	1/2	2.85s
Total Tes 2 Tes Salah 1 Total Biaya $0.003 Waktu respons (rata-rata) 2.85s
#200	MiMo-V2-Flash none	Xiaomi	1	2.9	$0.025	0/2	19.7s
Total Tes 2 Tes Salah 2 Total Biaya $0.025 Waktu respons (rata-rata) 19.7s
#202	Grok Build 0.1 none	X AI	1	3.8	$0.547	0/2	9.33s
Total Tes 2 Tes Salah 2 Total Biaya $0.547 Waktu respons (rata-rata) 9.33s
#206	gpt-oss-120b none	OpenAI	1	6.5	$0.010	1/2	7.12s
Total Tes 2 Tes Salah 1 Total Biaya $0.010 Waktu respons (rata-rata) 7.12s
#209	Step 3.5 Flash none	Stepfun	1	1.5	$0.020	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $0.020 Waktu respons (rata-rata) 0ms

Filter model

Model teratas menurut Jumlah Kesalahan API

Jumlah Kesalahan API vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang

Parsing dan ekstraksi data: Kesalahan API

Filter model

Model teratas menurut Jumlah Kesalahan API

Jumlah Kesalahan API vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang