Kushindwa kwa kategoria za AI BENCHY
Mwito wa zana: Hakuna jibu
Mwito wa zana
Hakuna jibu
Ona ni modeli gani za AI zina uwezekano mkubwa wa kupata Hakuna jibu katika Mwito wa zana, ili uone udhaifu haraka.
Sababu za kushindwa
| Nafasi | Modeli | Kampuni | Idadi ya Hakuna jibu | Alama ya kategoria | Majaribio sahihi | Muda wa majibu (wastani) |
|---|---|---|---|---|---|---|
| #40 | GPT-5.2 medium | OpenAI | 1 | 4.7 | 0/1 | 10.3s |
| #52 | Grok 4.1 Fast medium | X AI | 1 | 2.8 | 0/1 | 27.7s |