Kushindwa kwa kategoria za AI BENCHY
Mchanganyiko: Muda umeisha
Mchanganyiko
Muda umeisha
Ona ni modeli gani za AI zina uwezekano mkubwa wa kupata Muda umeisha katika Mchanganyiko, ili uone udhaifu haraka. Panga kwa: Idadi ya kushindwa ↑.
Sababu za kushindwa
| Nafasi | Modeli | Kampuni | Idadi ya Muda umeisha | Alama ya kategoria | Majaribio sahihi | Muda wa majibu (wastani) |
|---|---|---|---|---|---|---|
| #50 | Hunter Alpha medium | OpenRouter | 1 | 4.7 | 0/1 | 30.5s |
| #97 | Qwen3.5-9B medium | Qwen | 1 | 3.0 | 0/1 | 0ms |