সমন্বিত মডেল র‌্যাঙ্কিং

দেখুন সমন্বিত এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: সঠিক টেস্ট ↓.

দেখানো মডেল

গড় সমন্বিত স্কোর

5.6

সেরা মডেল

Gemini 3.6 Flash 10.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ অবৈধ টুল কল সহ91 ব্যর্থতার কারণ ভুল উত্তর সহ69 ব্যর্থতার কারণ কোন উত্তর নেই সহ32 ব্যর্থতার কারণ API ত্রুটি সহ26 ব্যর্থতার কারণ টাইমআউট সহ5 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ1 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ1

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	সমন্বিত স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#155	KAT-Coder-Air V2.5 medium	Kwaipilot	6.5	5.6	$0.048	1/2	19.6s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.048 প্রতিক্রিয়া সময় (গড়) 19.6s
#164	KAT-Coder-Air V2.5 low	Kwaipilot	6.4	5.4	$0.041	1/2	55.9s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.041 প্রতিক্রিয়া সময় (গড়) 55.9s
#168	Ling-2.6-1T none	Inclusionai	6.5	5.3	$0.016	1/2	23.8s
মোট টেস্ট 2 ভুল টেস্ট 1 মোট খরচ $0.016 প্রতিক্রিয়া সময় (গড়) 23.8s
#30	Muse Spark 1.1 high	Meta	5.9	8.1	$1.694	0/2	70.3s
মোট টেস্ট 2 ভুল টেস্ট 2 মোট খরচ $1.694 প্রতিক্রিয়া সময় (গড়) 70.3s
#65	Gemini 3 Flash Preview low	Google	3.0	7.4	$0.177	0/2	10.2s
মোট টেস্ট 2 ভুল টেস্ট 2 মোট খরচ $0.177 প্রতিক্রিয়া সময় (গড়) 10.2s
#83	Gemini 3.5 Flash none	Google	3.0	7.0	$1.079	0/2	0ms
মোট টেস্ট 2 ভুল টেস্ট 2 মোট খরচ $1.079 প্রতিক্রিয়া সময় (গড়) 0ms
#92	Gemini 3.5 Flash minimal	Google	3.0	6.8	$0.300	0/2	14.4s
মোট টেস্ট 2 ভুল টেস্ট 2 মোট খরচ $0.300 প্রতিক্রিয়া সময় (গড়) 14.4s
#93	Gemini 3 Flash Preview none	Google	3.8	6.8	$0.085	0/2	12.4s
মোট টেস্ট 2 ভুল টেস্ট 2 মোট খরচ $0.085 প্রতিক্রিয়া সময় (গড়) 12.4s
#94	Qwen3.6 35B A3B medium	Qwen	3.0	6.7	$0.746	0/2	817.6s
মোট টেস্ট 2 ভুল টেস্ট 2 মোট খরচ $0.746 প্রতিক্রিয়া সময় (গড়) 817.6s
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	4.1	6.7	$0.476	0/2	183.1s
মোট টেস্ট 2 ভুল টেস্ট 2 মোট খরচ $0.476 প্রতিক্রিয়া সময় (গড়) 183.1s
#98	GLM 5V Turbo medium	Z.ai	3.4	6.7	$0.457	0/1	15.1s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.457 প্রতিক্রিয়া সময় (গড়) 15.1s
#104	Gemini 3.5 Flash-Lite medium	Google	3.8	6.5	$0.369	0/2	28.7s
মোট টেস্ট 2 ভুল টেস্ট 2 মোট খরচ $0.369 প্রতিক্রিয়া সময় (গড়) 28.7s
#105	Qwen3.6 27B medium	Qwen	6.7	6.5	$0.779	0/2	584.1s
মোট টেস্ট 2 ভুল টেস্ট 2 মোট খরচ $0.779 প্রতিক্রিয়া সময় (গড়) 584.1s
#110	Gemini 3.1 Flash Lite Preview low	Google	3.0	6.5	$0.646	0/2	160.6s
মোট টেস্ট 2 ভুল টেস্ট 2 মোট খরচ $0.646 প্রতিক্রিয়া সময় (গড়) 160.6s
#111	Gemini 3.1 Flash Lite low	Google	3.2	6.5	$0.621	0/2	161.2s
মোট টেস্ট 2 ভুল টেস্ট 2 মোট খরচ $0.621 প্রতিক্রিয়া সময় (গড়) 161.2s

সমন্বিত র‌্যাঙ্কিং

মডেল ফিল্টার করুন

সমন্বিত স্কোর অনুযায়ী শীর্ষ মডেল

সমন্বিত স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল