AI BENCHY
Advertise here

Kushindwa kwa kategoria za AI BENCHY

Uandishi wa msimbo: Muundo wa ziada

Uandishi wa msimbo
Muundo wa ziada

Ona ni modeli gani za AI zina uwezekano mkubwa wa kupata Muundo wa ziada katika Uandishi wa msimbo, ili uone udhaifu haraka. Panga kwa: Muda wa majibu (wastani) ↑.

Modeli zilizoonyeshwa

7

Jumla ya kushindwa

7

Modeli iliyoathirika zaidi

MiMo-V2-Omni 1
Nafasi Modeli Kampuni Idadi ya Muundo wa ziada Alama ya kategoria Majaribio sahihi Muda wa majibu (wastani)
#93 MiMo-V2-Omni none Xiaomi 1 5.1 0/2 2.75s
#69 Claude Sonnet 4.6 none Anthropic 1 6.8 1/2 6.73s
#46 Claude Sonnet 4.6 medium Anthropic 1 6.9 1/2 33.9s
#106 Owl Alpha none Openrouter 1 7.0 1/2 39.7s
#31 Grok 4.3 medium X AI 1 7.4 1/2 55.3s
#45 Grok Build 0.1 medium X AI 1 5.3 0/2 67.4s
#40 MiMo-V2.5-Pro medium Xiaomi 1 7.0 1/2 81.7s

Modeli bora kwa Idadi ya Muundo wa ziada

Idadi ya Muundo wa ziada dhidi ya Alama

Modeli bora kwa Muda wa majibu (wastani)

Modeli bora kwa Gharama iliyopotezwa inayokadiriwa