AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY ব্যর্থতা

অবৈধ টুল কল ব্যর্থতা

দেখুন কোন AI মডেলগুলো সবচেয়ে বেশি অবৈধ টুল কল সমস্যায় পড়ে, যাতে বেছে নেওয়ার আগে নির্ভরযোগ্যতার ঝুঁকি বুঝতে পারেন। সাজান: প্রতিক্রিয়া সময় (গড়) ↓.

দেখানো মডেল

15

মোট ব্যর্থতা

26

সবচেয়ে বেশি প্রভাবিত মডেল

MiniMax M2.5 1
র‍্যাঙ্ক মডেল কোম্পানি অবৈধ টুল কল সংখ্যা স্কোর সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়)
#129 MiniMax M2.5 medium Minimax 1 5.3 5/21 65.4s
#78 Qwen3.6 27B medium Qwen 1 6.8 10/21 59.7s
#119 Cobuddy medium Baidu 1 5.6 7/21 39.9s
#130 MiniMax M2.7 medium Minimax 1 5.3 5/21 38.2s
#158 GLM 4.7 Flash medium Z.ai 1 4.4 4/21 35.1s
#139 DeepSeek V4 Flash none DeepSeek 1 5.0 5/21 26.8s
#59 GLM 5V Turbo medium Z.ai 2 7.2 11/21 23.1s
#133 DeepSeek V3.2 none DeepSeek 1 5.2 6/21 13.8s
#138 Ling-2.6-flash none Inclusionai 2 5.0 6/21 9.34s
#159 Ling-2.6-1T none Inclusionai 1 4.3 3/21 7.72s
#107 Laguna Xs.2 medium Poolside 1 5.8 6/19 6.73s
#112 GLM 5.1 none Z.ai 1 5.7 7/21 4.10s
#118 Qwen3.6 27B none Qwen 1 5.6 7/21 3.72s
#145 Laguna M.1 none Poolside 1 4.8 4/19 2.89s
#122 GLM 4.7 Flash none Z.ai 1 5.5 6/21 2.86s

অবৈধ টুল কল সংখ্যা অনুযায়ী শীর্ষ মডেল

অবৈধ টুল কল সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল