Peringkat Parsing dan ekstraksi data x Kesalahan API

Lihat model AI mana yang paling mungkin mengalami Kesalahan API di Parsing dan ekstraksi data, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Tes benar ↓.

Model yang ditampilkan

Total kegagalan

Model yang paling terdampak

Gemini 3.5 Flash 1

Alasan kegagalan

Jawaban salah41 Kesalahan API14 Tidak ada jawaban8 Format tambahan6 Kedaluwarsa1

Kategori

Pemrograman45 Gabungan26 Pemanggilan alat17 Parsing dan ekstraksi data14 Trik anti-AI14 Pengetahuan umum13 Kecerdasan umum12 Pemecahan teka-teki12 Spesifik domain7 Kepatuhan instruksi1

14/14

Peringkat	Model	Perusahaan	Jumlah Kesalahan API	Skor kategori	Total Biaya	Tes benar	Waktu respons (rata-rata)
#79	Gemini 3.5 Flash none	Google	1	6.5	$1.079	1/2	8.10s
Total Tes 2 Tes Salah 1 Total Biaya $1.079 Waktu respons (rata-rata) 8.10s
#100	Hy3 preview medium	Tencent	1	6.5	$0.018	1/2	5.25s
Total Tes 2 Tes Salah 1 Total Biaya $0.018 Waktu respons (rata-rata) 5.25s
#113	MiMo-V2-Flash medium	Xiaomi	1	6.5	$0.043	1/2	0ms
Total Tes 2 Tes Salah 1 Total Biaya $0.043 Waktu respons (rata-rata) 0ms
#114	Qwen3.5-Flash medium	Qwen	1	7.3	$0.139	1/2	57.0s
Total Tes 2 Tes Salah 1 Total Biaya $0.139 Waktu respons (rata-rata) 57.0s
#119	Qwen3.5-35B-A3B medium	Qwen	1	7.3	$0.837	1/2	59.3s
Total Tes 2 Tes Salah 1 Total Biaya $0.837 Waktu respons (rata-rata) 59.3s
#135	Hy3 preview high	Tencent	1	6.5	$0.048	1/2	12.1s
Total Tes 2 Tes Salah 1 Total Biaya $0.048 Waktu respons (rata-rata) 12.1s
#153	Hy3 preview low	Tencent	1	6.5	$0.015	1/2	5.85s
Total Tes 2 Tes Salah 1 Total Biaya $0.015 Waktu respons (rata-rata) 5.85s
#167	Mistral Small 4 medium	Mistral	1	7.3	$0.096	1/2	1.23s
Total Tes 2 Tes Salah 1 Total Biaya $0.096 Waktu respons (rata-rata) 1.23s
#199	Hy3 preview none	Tencent	1	6.5	$0.003	1/2	2.85s
Total Tes 2 Tes Salah 1 Total Biaya $0.003 Waktu respons (rata-rata) 2.85s
#206	gpt-oss-120b none	OpenAI	1	6.5	$0.010	1/2	7.12s
Total Tes 2 Tes Salah 1 Total Biaya $0.010 Waktu respons (rata-rata) 7.12s
#179	Ring-2.6-1T none	Inclusionai	1	3.0	$0.026	0/2	45.9s
Total Tes 2 Tes Salah 2 Total Biaya $0.026 Waktu respons (rata-rata) 45.9s
#200	MiMo-V2-Flash none	Xiaomi	1	2.9	$0.025	0/2	19.7s
Total Tes 2 Tes Salah 2 Total Biaya $0.025 Waktu respons (rata-rata) 19.7s
#202	Grok Build 0.1 none	X AI	1	3.8	$0.547	0/2	9.33s
Total Tes 2 Tes Salah 2 Total Biaya $0.547 Waktu respons (rata-rata) 9.33s
#209	Step 3.5 Flash none	Stepfun	1	1.5	$0.020	0/1	0ms
Total Tes 1 Tes Salah 1 Total Biaya $0.020 Waktu respons (rata-rata) 0ms

Filter model

Model teratas menurut Jumlah Kesalahan API

Jumlah Kesalahan API vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang

Parsing dan ekstraksi data: Kesalahan API

Filter model

Model teratas menurut Jumlah Kesalahan API

Jumlah Kesalahan API vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang