কোডিং মডেল র‌্যাঙ্কিং

AI BENCHY বিভাগ

দেখুন কোডিং এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: মেট্রিক ↑.

দেখানো মডেল

গড় কোডিং স্কোর

5.7

সেরা মডেল

Gemini 3.1 Flash Lite Preview 0.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ230 ব্যর্থতার কারণ API ত্রুটি সহ43 ব্যর্থতার কারণ টাইমআউট সহ25 ব্যর্থতার কারণ কোন উত্তর নেই সহ18 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ16 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ12

189/189

র‍্যাঙ্ক	মডেল	কোম্পানি	কোডিং স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#47	Grok 4.3 medium	X AI	5.9	7.7	$0.614	1/3	41.2s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.614 প্রতিক্রিয়া সময় (গড়) 41.2s
#92	gpt-oss-120b medium	OpenAI	5.9	6.7	$0.013	1/3	38.4s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.013 প্রতিক্রিয়া সময় (গড়) 38.4s
#61	DeepSeek V3.2 medium	DeepSeek	6.0	7.5	$0.042	1/3	248.7s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.042 প্রতিক্রিয়া সময় (গড়) 248.7s
#45	Qwen3.5-122B-A10B medium	Qwen	6.0	7.7	$0.588	1/3	114.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.588 প্রতিক্রিয়া সময় (গড়) 114.5s
#69	GLM 5V Turbo medium	Z.ai	6.0	7.3	$0.457	1/3	63.4s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.457 প্রতিক্রিয়া সময় (গড়) 63.4s
#75	MiMo-V2-Flash medium	Xiaomi	6.0	7.1	$0.043	1/3	10.7s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.043 প্রতিক্রিয়া সময় (গড়) 10.7s
#91	Mimo V2 PRO medium	Xiaomi	6.0	6.7	$0.333	1/3	94.2s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.333 প্রতিক্রিয়া সময় (গড়) 94.2s
#37	Qwen3.6 Plus medium	Qwen	6.1	7.8	$0.294	1/3	153.1s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.294 প্রতিক্রিয়া সময় (গড়) 153.1s
#52	MiniMax M3 medium	Minimax	6.1	7.6	$0.131	1/3	144.7s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.131 প্রতিক্রিয়া সময় (গড়) 144.7s
#53	DeepSeek V4 Pro high	DeepSeek	6.1	7.6	$0.157	1/3	243.0s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.157 প্রতিক্রিয়া সময় (গড়) 243.0s
#56	Kimi K2.5 medium	Moonshot AI	6.1	7.5	$0.348	1/3	217.5s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.348 প্রতিক্রিয়া সময় (গড়) 217.5s
#59	GPT-5.4 Nano medium	OpenAI	6.1	7.5	$0.107	1/3	19.1s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.107 প্রতিক্রিয়া সময় (গড়) 19.1s
#30	Qwen3.7 Plus medium	Qwen	6.1	8.2	$0.177	1/3	108.6s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.177 প্রতিক্রিয়া সময় (গড়) 108.6s
#38	GPT-5.6 Terra medium	OpenAI	6.1	7.8	$0.496	1/3	7.19s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.496 প্রতিক্রিয়া সময় (গড়) 7.19s
#35	Qwen3.5-27B medium	Qwen	6.2	7.9	$0.536	1/3	160.7s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.536 প্রতিক্রিয়া সময় (গড়) 160.7s

কোডিং র‌্যাঙ্কিং

মডেল ফিল্টার করুন

কোডিং স্কোর অনুযায়ী শীর্ষ মডেল

কোডিং স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল