Kushindwa kwa kategoria za AI BENCHY
Uandishi wa msimbo: Hakufuata maelekezo
Uandishi wa msimbo
Hakufuata maelekezo
Ona ni modeli gani za AI zina uwezekano mkubwa wa kupata Hakufuata maelekezo katika Uandishi wa msimbo, ili uone udhaifu haraka.
Sababu za kushindwa
| Nafasi | Modeli | Kampuni | Idadi ya Hakufuata maelekezo | Alama ya kategoria | Majaribio sahihi | Muda wa majibu (wastani) |
|---|---|---|---|---|---|---|
| #49 | Grok 4.1 Fast medium | X AI | 1 | 2.3 | 0/1 | 23.6s |
| #91 | Qwen3.5-9B medium | Qwen | 1 | 2.6 | 0/1 | 135.6s |