Kushindwa kwa kategoria za AI BENCHY
Mwito wa zana: Mwito wa zana si sahihi
Mwito wa zana
Mwito wa zana si sahihi
Ona ni modeli gani za AI zina uwezekano mkubwa wa kupata Mwito wa zana si sahihi katika Mwito wa zana, ili uone udhaifu haraka. Panga kwa: Muda wa majibu (wastani) ↑.
Sababu za kushindwa
Kategoria
| Nafasi | Modeli | Kampuni | Idadi ya Mwito wa zana si sahihi | Alama ya kategoria | Majaribio sahihi | Muda wa majibu (wastani) |
|---|---|---|---|---|---|---|
| #85 | Elephant none | Openrouter | 1 | 3.0 | 0/1 | 2.79s |
| #81 | Elephant medium | Openrouter | 1 | 3.0 | 0/1 | 2.83s |
| #31 | GLM 5V Turbo medium | Z.ai | 1 | 7.0 | 0/1 | 12.5s |