কোডিং মডেল র‌্যাঙ্কিং

AI BENCHY বিভাগ

দেখুন কোডিং এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: সঠিক টেস্ট ↓.

দেখানো মডেল

গড় কোডিং স্কোর

5.7

সেরা মডেল

Gemini 3.5 Flash 10.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ230 ব্যর্থতার কারণ API ত্রুটি সহ43 ব্যর্থতার কারণ টাইমআউট সহ25 ব্যর্থতার কারণ কোন উত্তর নেই সহ18 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ16 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ12

189/189

র‍্যাঙ্ক	মডেল	কোম্পানি	কোডিং স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#93	GPT-5 Nano medium	OpenAI	7.0	6.7	$0.081	1/3	41.6s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.081 প্রতিক্রিয়া সময় (গড়) 41.6s
#96	Gemini 3.1 Flash Lite Preview low	Google	5.5	6.5	$0.026	1/3	1.39s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.026 প্রতিক্রিয়া সময় (গড়) 1.39s
#98	Gemini 3.1 Flash Lite Preview none	Google	5.5	6.4	$0.018	1/3	967ms
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.018 প্রতিক্রিয়া সময় (গড়) 967ms
#99	Gemini 3.1 Flash Lite low	Google	5.5	6.4	$0.028	1/3	1.53s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.028 প্রতিক্রিয়া সময় (গড়) 1.53s
#100	Hy3 preview low	Tencent	5.3	6.4	$0.015	1/3	27.9s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.015 প্রতিক্রিয়া সময় (গড়) 27.9s
#102	GPT-5.6 Sol none	OpenAI	5.5	6.3	$0.225	1/3	1.39s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.225 প্রতিক্রিয়া সময় (গড়) 1.39s
#104	Qwen3.5-35B-A3B medium	Qwen	5.9	6.3	$0.401	1/3	206.6s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.401 প্রতিক্রিয়া সময় (গড়) 206.6s
#105	GPT-5.5 none	OpenAI	5.5	6.3	$0.231	1/3	1.35s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.231 প্রতিক্রিয়া সময় (গড়) 1.35s
#107	Seed-2.0-Lite none	Bytedance Seed	5.6	6.2	$0.019	1/3	2.83s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.019 প্রতিক্রিয়া সময় (গড়) 2.83s
#108	GPT-5.6 Luna low	OpenAI	5.5	6.2	$0.141	1/3	4.61s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.141 প্রতিক্রিয়া সময় (গড়) 4.61s
#109	Gemini 2.5 Flash none	Google	5.5	6.2	$0.016	1/3	736ms
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.016 প্রতিক্রিয়া সময় (গড়) 736ms
#110	Gemini 3.1 Flash Lite minimal	Google	5.5	6.1	$0.013	1/3	831ms
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.013 প্রতিক্রিয়া সময় (গড়) 831ms
#112	Gemini 3.1 Flash Lite none	Google	5.5	6.1	$0.013	1/3	938ms
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.013 প্রতিক্রিয়া সময় (গড়) 938ms
#113	Qwen3.5-Flash none	Qwen	5.5	6.1	$0.005	1/3	850ms
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.005 প্রতিক্রিয়া সময় (গড়) 850ms
#114	Gemma 4 31B none	Google	5.5	6.1	$0.004	1/3	11.2s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.004 প্রতিক্রিয়া সময় (গড়) 11.2s

কোডিং র‌্যাঙ্কিং

মডেল ফিল্টার করুন

কোডিং স্কোর অনুযায়ী শীর্ষ মডেল

কোডিং স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল