Kushindwa kwa kategoria za AI BENCHY
Utatuzi wa mafumbo
Muundo wa ziada
Utatuzi wa mafumbo
Muundo wa ziada
Ona ni modeli gani za AI zina uwezekano mkubwa wa kupata Muundo wa ziada katika Utatuzi wa mafumbo, ili uone udhaifu haraka.
Sababu zinazohusiana za kushindwa
Kategoria zinazohusiana
| Nafasi | Modeli | Kampuni | Idadi ya Muundo wa ziada | Alama ya kategoria | Majaribio sahihi | Muda wa majibu (wastani) |
|---|---|---|---|---|---|---|
| #25 | Claude Sonnet 4.6 none | Anthropic | 1 | 7.0 | 2/3 | 2.92s |