কোডিং মডেল র‌্যাঙ্কিং

AI BENCHY বিভাগ

দেখুন কোডিং এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: সঠিক টেস্ট ↑.

দেখানো মডেল

গড় কোডিং স্কোর

5.7

সেরা মডেল

Qwen3.6 Flash 5.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ230 ব্যর্থতার কারণ API ত্রুটি সহ43 ব্যর্থতার কারণ টাইমআউট সহ25 ব্যর্থতার কারণ কোন উত্তর নেই সহ18 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ16 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ12

189/189

র‍্যাঙ্ক	মডেল	কোম্পানি	কোডিং স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#129	GPT-5.4 none	OpenAI	5.5	5.8	$0.122	1/3	1.62s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.122 প্রতিক্রিয়া সময় (গড়) 1.62s
#136	Kimi K2.5 none	Moonshot AI	5.5	5.5	$0.027	1/3	24.6s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.027 প্রতিক্রিয়া সময় (গড়) 24.6s
#138	Qwen3.6 27B none	Qwen	5.5	5.5	$0.025	1/3	4.16s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.025 প্রতিক্রিয়া সময় (গড়) 4.16s
#144	GPT-5.4 Mini none	OpenAI	5.5	5.3	$0.038	1/3	913ms
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.038 প্রতিক্রিয়া সময় (গড়) 913ms
#147	MiniMax M2.7 medium	Minimax	5.7	5.2	$0.100	1/3	101.9s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.100 প্রতিক্রিয়া সময় (গড়) 101.9s
#148	Qwen3.6 35B A3B none	Qwen	5.5	5.2	$0.031	1/3	8.77s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.031 প্রতিক্রিয়া সময় (গড়) 8.77s
#154	MiMo-V2.5 none	Xiaomi	5.5	5.1	$0.006	1/3	3.24s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.006 প্রতিক্রিয়া সময় (গড়) 3.24s
#163	Ling-2.6-flash none	Inclusionai	5.3	4.9	$0.001	1/3	11.2s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.001 প্রতিক্রিয়া সময় (গড়) 11.2s
#164	Ring-2.6-1T none	Inclusionai	5.3	4.8	$0.026	1/3	143.8s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.026 প্রতিক্রিয়া সময় (গড়) 143.8s
#2	Gemini 3 Flash Preview medium	Google	8.6	9.6	$0.667	2/3	84.4s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.667 প্রতিক্রিয়া সময় (গড়) 84.4s
#8	Gemini 3.5 Flash low	Google	7.8	9.2	$0.349	2/3	6.71s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.349 প্রতিক্রিয়া সময় (গড়) 6.71s
#10	Gemini 3.1 Pro Preview medium	Google	7.9	9.2	$1.054	2/3	40.2s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $1.054 প্রতিক্রিয়া সময় (গড়) 40.2s
#11	Gemini 3.5 Flash medium	Google	7.9	9.1	$0.582	2/3	12.6s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.582 প্রতিক্রিয়া সময় (গড়) 12.6s
#12	GPT-5.5 medium	OpenAI	8.8	9.0	$3.679	2/3	59.8s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $3.679 প্রতিক্রিয়া সময় (গড়) 59.8s
#14	Qwen3.6 Max Preview medium	Qwen	8.8	8.9	$0.960	2/3	146.5s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.960 প্রতিক্রিয়া সময় (গড়) 146.5s

←

1 9 10 11 13

→

কোডিং র‌্যাঙ্কিং

মডেল ফিল্টার করুন

কোডিং স্কোর অনুযায়ী শীর্ষ মডেল

কোডিং স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল