টাইমআউট ব্যর্থতা র‌্যাঙ্কিং | AI BENCHY

AI BENCHY ব্যর্থতা

দেখুন কোন AI মডেলগুলো সবচেয়ে বেশি টাইমআউট সমস্যায় পড়ে, যাতে বেছে নেওয়ার আগে নির্ভরযোগ্যতার ঝুঁকি বুঝতে পারেন। সাজান: সঠিক টেস্ট ↑.

দেখানো মডেল

15

মোট ব্যর্থতা

73

সবচেয়ে বেশি প্রভাবিত মডেল

বিভাগ

ডোমেইন-নির্দিষ্ট বিভাগে34 কোডিং বিভাগে23 ধাঁধা সমাধান বিভাগে5 Sadharon Buddhimotta বিভাগে4 অ্যান্টি-এআই কৌশল বিভাগে4 সমন্বিত বিভাগে2 ডেটা পার্সিং ও নিষ্কাশন বিভাগে1

র‍্যাঙ্ক	মডেল	কোম্পানি	টাইমআউট সংখ্যা	স্কোর	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#161	Qwen3.5-9B medium	Qwen	11	4.2	3/21	82.2s
#150	Qwen3 Coder Next medium	Qwen	1	4.6	4/21	8.58s
#158	GLM 4.7 Flash medium	Z.ai	2	4.4	4/21	35.1s
#129	MiniMax M2.5 medium	Minimax	4	5.3	5/21	65.4s
#130	MiniMax M2.7 medium	Minimax	2	5.3	5/21	38.2s
#102	Gemma 4 26B A4B none	Google	1	6.0	8/21	5.91s
#103	DeepSeek V4 Pro high	DeepSeek	3	6.0	8/21	65.2s
#105	Nemotron 3 Super medium	NVIDIA	1	5.8	8/21	32.0s
#94	GPT-5 Nano medium	OpenAI	1	6.3	9/21	42.5s
#79	Hunter Alpha medium	OpenRouter	2	6.7	8/18	10.3s
#86	Grok 4.1 Fast medium	X AI	1	6.5	9/19	23.8s
#76	Kimi K2.5 medium	Moonshot AI	2	6.8	10/21	98.4s
#66	Qwen3.5-35B-A3B medium	Qwen	5	7.1	11/21	72.6s
#67	MiniMax M3 medium	Minimax	3	7.1	11/21	68.2s
#72	DeepSeek V3.2 medium	DeepSeek	2	7.0	11/21	68.7s

টাইমআউট সংখ্যা অনুযায়ী শীর্ষ মডেল

টাইমআউট সংখ্যা বনাম স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল