Kushindwa kwa kategoria za AI BENCHY
Mwito wa zana: Hakuna jibu
Mwito wa zana
Hakuna jibu
Ona ni modeli gani za AI zina uwezekano mkubwa wa kupata Hakuna jibu katika Mwito wa zana, ili uone udhaifu haraka. Panga kwa: Idadi ya kushindwa ↑.
Sababu za kushindwa
| Nafasi | Modeli | Kampuni | Idadi ya Hakuna jibu | Alama ya kategoria | Majaribio sahihi | Muda wa majibu (wastani) |
|---|---|---|---|---|---|---|
| #40 | GPT-5.2 medium | OpenAI | 1 | 4.7 | 0/1 | 10.3s |
| #52 | Grok 4.1 Fast medium | X AI | 1 | 2.8 | 0/1 | 27.7s |