AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Kushindwa kwa kategoria za AI BENCHY

Mchanganyiko: Hitilafu ya API

Mchanganyiko
Hitilafu ya API

Ona ni modeli gani za AI zina uwezekano mkubwa wa kupata Hitilafu ya API katika Mchanganyiko, ili uone udhaifu haraka.

Modeli zilizoonyeshwa

5

Jumla ya kushindwa

5

Modeli iliyoathirika zaidi

Gemma 4 31B 1
Nafasi Modeli Kampuni Idadi ya Hitilafu ya API Alama ya kategoria Majaribio sahihi Muda wa majibu (wastani)
#14 Gemma 4 31B medium Google 1 3.0 0/1 0ms
#48 Gemma 4 31B none Google 1 3.0 0/1 0ms
#56 Grok 4.20 Multi Agent Beta medium X AI 1 3.0 0/1 0ms
#84 gpt-oss-120b none OpenAI 1 3.0 0/1 0ms
#98 LFM2-24B-A2B none Liquid 1 3.0 0/1 0ms

Modeli bora kwa Idadi ya Hitilafu ya API

Idadi ya Hitilafu ya API dhidi ya Alama

Modeli bora kwa Muda wa majibu (wastani)

Modeli bora kwa Gharama iliyopotezwa inayokadiriwa