Kategori AI BENCHY
Peringkat Parsing dan ekstraksi data
Lihat model AI mana yang paling baik di Parsing dan ekstraksi data, mana yang tetap andal, dan di mana kesenjangan terbesar muncul. Urutkan berdasarkan: Waktu respons (rata-rata) ↓.
| Peringkat | Model | Perusahaan | Skor Parsing dan ekstraksi data | Skor | Tes benar | Waktu respons (rata-rata) |
|---|---|---|---|---|---|---|
| #90 | Qwen3.5-9B none | Qwen | 10.0 | 4.8 | 2/2 | 847ms |
| #83 | Mistral Small 4 none | Mistral | 10.0 | 5.2 | 2/2 | 822ms |
| #98 | LFM2-24B-A2B none | Liquid | 3.0 | 4.1 | 0/2 | 714ms |
| #91 | Mercury 2 none | Inception | 7.3 | 4.8 | 1/2 | 667ms |
| #62 | Gemini 2.5 Flash none | 10.0 | 6.2 | 2/2 | 652ms | |
| #79 | Grok 4.20 Beta none | X AI | 10.0 | 5.3 | 2/2 | 601ms |
| #82 | Grok 4.20 none | X AI | 10.0 | 5.2 | 2/2 | 522ms |
| #41 | MiMo-V2-Flash medium | Xiaomi | 6.5 | 7.5 | 1/2 | 0ms |