সমন্বিত মডেল র‌্যাঙ্কিং

দেখুন সমন্বিত এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: সঠিক টেস্ট ↓.

দেখানো মডেল

গড় সমন্বিত স্কোর

5.6

সেরা মডেল

Gemini 3.6 Flash 10.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ অবৈধ টুল কল সহ91 ব্যর্থতার কারণ ভুল উত্তর সহ69 ব্যর্থতার কারণ কোন উত্তর নেই সহ32 ব্যর্থতার কারণ API ত্রুটি সহ26 ব্যর্থতার কারণ টাইমআউট সহ5 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ1 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	সমন্বিত স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#80	DeepSeek V3.2 medium	DeepSeek	7.3	7.0	$0.078	1/2	79.9s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.078 প্রতিক্রিয়া সময় (গড়) 79.9s
#81	Kimi K2.5 medium	Moonshot AI	6.7	7.0	$0.600	1/2	89.2s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.600 প্রতিক্রিয়া সময় (গড়) 89.2s
#82	Mercury 2 medium	Inception	6.7	7.0	$0.093	1/2	7.84s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.093 প্রতিক্রিয়া সময় (গড়) 7.84s
#84	Seed-2.0-Mini medium	Bytedance Seed	7.3	7.0	$0.101	1/2	282.3s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.101 প্রতিক্রিয়া সময় (গড়) 282.3s
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	6.4	6.9	$0.467	1/2	135.7s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.467 প্রতিক্রিয়া সময় (গড়) 135.7s
#86	DeepSeek V4 Pro none	DeepSeek	7.9	6.9	$0.096	1/2	71.6s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.096 প্রতিক্রিয়া সময় (গড়) 71.6s
#87	GPT-5.6 Sol none	OpenAI	6.5	6.9	$0.524	1/2	8.37s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.524 প্রতিক্রিয়া সময় (গড়) 8.37s
#88	MiMo-V2.5-Pro medium	Xiaomi	6.9	6.9	$0.187	1/2	125.4s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.187 প্রতিক্রিয়া সময় (গড়) 125.4s
#89	Qwen3.6 Flash medium	Qwen	6.5	6.9	$0.738	1/2	299.2s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.738 প্রতিক্রিয়া সময় (গড়) 299.2s
#90	Step 3.7 Flash high	Stepfun	8.7	6.9	$1.207	1/2	41.2s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $1.207 প্রতিক্রিয়া সময় (গড়) 41.2s
#91	GPT-5.5 none	OpenAI	6.5	6.9	$0.544	1/2	8.90s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.544 প্রতিক্রিয়া সময় (গড়) 8.90s
#95	Gemini 3.5 Flash-Lite low	Google	6.3	6.7	$0.145	1/2	8.96s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.145 প্রতিক্রিয়া সময় (গড়) 8.96s
#100	Gemma 4 26B A4B medium	Google	6.3	6.6	$0.089	1/2	492.9s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.089 প্রতিক্রিয়া সময় (গড়) 492.9s
#101	GLM 5.2 none	Z.ai	6.9	6.6	$0.128	1/2	50.2s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.128 প্রতিক্রিয়া সময় (গড়) 50.2s
#103	Qwen3.6 Max Preview none	Qwen	6.5	6.6	$0.231	1/2	61.6s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.231 প্রতিক্রিয়া সময় (গড়) 61.6s

সমন্বিত র‌্যাঙ্কিং

মডেল ফিল্টার করুন

সমন্বিত স্কোর অনুযায়ী শীর্ষ মডেল

সমন্বিত স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল