AI BENCHY
Advertise here

AI BENCHY श्रेणी अपयशे

अँटी-एआय युक्त्या: सूचनांचे पालन केले नाही

अँटी-एआय युक्त्या
सूचनांचे पालन केले नाही

अँटी-एआय युक्त्या मध्ये कोणत्या AI मॉडेल्सना सूचनांचे पालन केले नाही येण्याची शक्यता जास्त आहे ते पाहा, म्हणजे कमकुवत बाजू लवकर ओळखता येतील.

दाखवलेली मॉडेल्स

15

एकूण अपयशे

30

सर्वाधिक प्रभावित मॉडेल

Hy3 preview 2
क्रमांक मॉडेल कंपनी सूचनांचे पालन केले नाही संख्या श्रेणी स्कोअर बरोबर चाचण्या प्रतिसाद वेळ (सरासरी)
#156 Hy3 preview none Tencent 2 4.8 1/4 11.1s
#22 Step 3.7 Flash medium Stepfun 1 8.7 3/4 9.65s
#40 Gemini 3.1 Flash Lite Preview medium Google 1 9.1 3/4 2.33s
#42 GPT-5.2 medium OpenAI 1 6.5 2/4 7.81s
#44 Gemini 3.1 Flash Lite medium Google 1 9.1 3/4 2.39s
#54 GPT-5 Mini medium OpenAI 1 7.1 2/4 13.9s
#58 Gemini 3.1 Flash Lite Preview none Google 1 7.5 2/4 1.04s
#59 GLM 5V Turbo medium Z.ai 1 7.2 2/4 10.8s
#60 Kimi K2.6 medium Moonshot AI 1 7.0 2/4 11.6s
#63 GPT-5.3 Chat none OpenAI 1 6.7 2/4 3.86s
#67 MiniMax M3 medium Minimax 1 5.5 1/4 14.9s
#81 Mercury 2 medium Inception 1 6.9 2/4 1.12s
#96 Ring-2.6-1T none Inclusionai 1 9.2 3/4 43.3s
#99 gpt-oss-120b medium OpenAI 1 6.7 2/4 10.2s
#101 Mimo V2 Omni none Xiaomi 1 3.6 0/4 1.63s

सूचनांचे पालन केले नाही संख्या नुसार शीर्ष मॉडेल्स

सूचनांचे पालन केले नाही संख्या वि स्कोअर

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स

अंदाजित वाया गेलेला खर्च नुसार शीर्ष मॉडेल्स