Kushindwa kwa kategoria za AI BENCHY
Ufuataji wa maagizo: Muundo wa ziada
Ufuataji wa maagizo
Muundo wa ziada
Ona ni modeli gani za AI zina uwezekano mkubwa wa kupata Muundo wa ziada katika Ufuataji wa maagizo, ili uone udhaifu haraka. Panga kwa: Muda wa majibu (wastani) ↑.
Sababu za kushindwa
| Nafasi | Modeli | Kampuni | Idadi ya Muundo wa ziada | Alama ya kategoria | Majaribio sahihi | Muda wa majibu (wastani) |
|---|---|---|---|---|---|---|
| #108 | HY3 Preview none | Tencent | 1 | 6.3 | 1/2 | 13.0s |
| #92 | DeepSeek V4 Flash none | DeepSeek | 1 | 6.5 | 1/2 | 17.5s |