AI BENCHY
Advertise here

Kushindwa kwa kategoria za AI BENCHY

Mahususi kwa domeni: Hitilafu ya API

Mahususi kwa domeni
Hitilafu ya API

Ona ni modeli gani za AI zina uwezekano mkubwa wa kupata Hitilafu ya API katika Mahususi kwa domeni, ili uone udhaifu haraka. Panga kwa: Muda wa majibu (wastani) ↑.

Modeli zilizoonyeshwa

6

Jumla ya kushindwa

6

Modeli iliyoathirika zaidi

LFM2-24B-A2B 1
Nafasi Modeli Kampuni Idadi ya Hitilafu ya API Alama ya kategoria Majaribio sahihi Muda wa majibu (wastani)
#160 LFM2-24B-A2B none Liquid 1 5.9 1/3 287ms
#133 DeepSeek V3.2 none DeepSeek 1 2.9 0/3 4.17s
#132 Mistral Small 4 medium Mistral 1 5.3 1/3 6.11s
#156 Hy3 preview none Tencent 1 3.6 0/3 17.6s
#93 Qwen3.6 Plus Preview medium Qwen 1 3.0 0/3 22.1s
#103 DeepSeek V4 Pro high DeepSeek 1 2.9 0/3 205.7s

Modeli bora kwa Idadi ya Hitilafu ya API

Idadi ya Hitilafu ya API dhidi ya Alama

Modeli bora kwa Muda wa majibu (wastani)

Modeli bora kwa Gharama iliyopotezwa inayokadiriwa