ধাঁধা সমাধান মডেল র‌্যাঙ্কিং

দেখুন ধাঁধা সমাধান এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↑.

দেখানো মডেল

গড় ধাঁধা সমাধান স্কোর

6.7

সেরা মডেল

Step 3.5 Flash 0.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ204 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ90 ব্যর্থতার কারণ API ত্রুটি সহ12 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ8 ব্যর্থতার কারণ টাইমআউট সহ5 ব্যর্থতার কারণ কোন উত্তর নেই সহ3

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	ধাঁধা সমাধান স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#67	Claude Sonnet 4.6 none	Anthropic	7.7	7.3	$0.661	2/3	2.53s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.661 প্রতিক্রিয়া সময় (গড়) 2.53s
#103	Qwen3.6 Max Preview none	Qwen	10.0	6.6	$0.231	3/3	2.65s
মোট টেস্ট 3 ভুল টেস্ট 0 মোট খরচ $0.231 প্রতিক্রিয়া সময় (গড়) 2.65s
#176	GLM 5 Turbo none	Z.ai	5.5	5.1	$0.047	1/3	2.65s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.047 প্রতিক্রিয়া সময় (গড়) 2.65s
#113	Qwen3.5 Plus 2026-02-15 none	Qwen	7.7	6.4	$0.073	2/3	2.71s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.073 প্রতিক্রিয়া সময় (গড়) 2.71s
#117	LongCat 2.0 none	Meituan	4.0	6.3	$0.044	0/3	2.74s
মোট টেস্ট 3 ভুল টেস্ট 3 মোট খরচ $0.044 প্রতিক্রিয়া সময় (গড়) 2.74s
#70	Claude Opus 4.8 none	Anthropic	7.7	7.3	$1.166	2/3	2.74s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $1.166 প্রতিক্রিয়া সময় (গড়) 2.74s
#122	Seed-2.0-Lite none	Bytedance Seed	5.3	6.2	$0.066	1/3	2.78s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.066 প্রতিক্রিয়া সময় (গড়) 2.78s
#129	Inkling low	Thinkingmachines	6.4	6.1	$0.187	1/3	2.97s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.187 প্রতিক্রিয়া সময় (গড়) 2.97s
#26	Claude Sonnet 5 medium	Anthropic	7.7	8.3	$0.922	2/3	2.98s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.922 প্রতিক্রিয়া সময় (গড়) 2.98s
#7	GPT-5.6 Sol medium	OpenAI	8.2	9.4	$1.316	2/3	2.98s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $1.316 প্রতিক্রিয়া সময় (গড়) 2.98s
#58	GPT-5.3 Chat none	OpenAI	10.0	7.5	$0.571	3/3	2.99s
মোট টেস্ট 3 ভুল টেস্ট 0 মোট খরচ $0.571 প্রতিক্রিয়া সময় (গড়) 2.99s
#45	Claude Opus 4.8 low	Anthropic	10.0	7.8	$2.077	3/3	3.01s
মোট টেস্ট 3 ভুল টেস্ট 0 মোট খরচ $2.077 প্রতিক্রিয়া সময় (গড়) 3.01s
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	8.2	6.7	$0.476	2/3	3.03s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.476 প্রতিক্রিয়া সময় (গড়) 3.03s
#2	Gemini 3.6 Flash high	Google	10.0	9.7	$1.785	3/3	3.04s
মোট টেস্ট 3 ভুল টেস্ট 0 মোট খরচ $1.785 প্রতিক্রিয়া সময় (গড়) 3.04s
#66	KAT-Coder-Pro V2.5 low	Kwaipilot	6.4	7.4	$0.387	1/3	3.11s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.387 প্রতিক্রিয়া সময় (গড়) 3.11s

ধাঁধা সমাধান র‌্যাঙ্কিং

মডেল ফিল্টার করুন

ধাঁধা সমাধান স্কোর অনুযায়ী শীর্ষ মডেল

ধাঁধা সমাধান স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল