Kushindwa kwa kategoria za AI BENCHY
Mwito wa zana: Mwito wa zana si sahihi
Mwito wa zana
Mwito wa zana si sahihi
Ona ni modeli gani za AI zina uwezekano mkubwa wa kupata Mwito wa zana si sahihi katika Mwito wa zana, ili uone udhaifu haraka.
Sababu za kushindwa
Kategoria
| Nafasi | Modeli | Kampuni | Idadi ya Mwito wa zana si sahihi | Alama ya kategoria | Majaribio sahihi | Muda wa majibu (wastani) |
|---|---|---|---|---|---|---|
| #31 | GLM 5V Turbo medium | Z.ai | 1 | 7.0 | 0/1 | 12.5s |
| #81 | Elephant medium | Openrouter | 1 | 3.0 | 0/1 | 2.83s |
| #85 | Elephant none | Openrouter | 1 | 3.0 | 0/1 | 2.79s |