Kushindwa kwa kategoria za AI BENCHY
Uchanganuzi na uchimbaji wa data
Hitilafu ya API
Uchanganuzi na uchimbaji wa data
Hitilafu ya API
Ona ni modeli gani za AI zina uwezekano mkubwa wa kupata Hitilafu ya API katika Uchanganuzi na uchimbaji wa data, ili uone udhaifu haraka. Panga kwa: Muda wa majibu (wastani) ↑.
Sababu zinazohusiana za kushindwa
Kategoria zinazohusiana
| Nafasi | Modeli | Kampuni | Idadi ya Hitilafu ya API | Alama ya kategoria | Majaribio sahihi | Muda wa majibu (wastani) |
|---|---|---|---|---|---|---|
| #21 | MiMo-V2-Flash medium | Xiaomi | 1 | 5.5 | 1/2 | 0ms |
| #54 | MiMo-V2-Flash none | Xiaomi | 1 | 10.0 | 0/2 | 19.7s |
| #24 | Qwen3.5-Flash medium | Qwen | 1 | 5.5 | 1/2 | 57.0s |
| #35 | Qwen3.5-35B-A3B medium | Qwen | 1 | 5.5 | 1/2 | 59.3s |