ধাঁধা সমাধান মডেল র‌্যাঙ্কিং

দেখুন ধাঁধা সমাধান এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: সঠিক টেস্ট ↑.

দেখানো মডেল

গড় ধাঁধা সমাধান স্কোর

6.7

সেরা মডেল

GPT-5.4 Nano 4.1

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ204 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ90 ব্যর্থতার কারণ API ত্রুটি সহ12 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ8 ব্যর্থতার কারণ টাইমআউট সহ5 ব্যর্থতার কারণ কোন উত্তর নেই সহ3

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	ধাঁধা সমাধান স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#28	Gemini 2.5 Flash medium	Google	7.7	8.2	$0.643	2/3	3.18s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.643 প্রতিক্রিয়া সময় (গড়) 3.18s
#30	Muse Spark 1.1 high	Meta	7.8	8.1	$1.694	2/3	70.0s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $1.694 প্রতিক্রিয়া সময় (গড়) 70.0s
#31	Gemini 3.5 Flash-Lite high	Google	8.2	8.1	$0.584	2/3	1.85s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.584 প্রতিক্রিয়া সময় (গড়) 1.85s
#34	GPT-5.2 Chat none	OpenAI	7.7	8.0	$0.604	2/3	4.10s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.604 প্রতিক্রিয়া সময় (গড়) 4.10s
#38	GPT-5.6 Terra high	OpenAI	7.7	8.0	$1.055	2/3	5.45s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $1.055 প্রতিক্রিয়া সময় (গড়) 5.45s
#39	Seed-2.0-Lite medium	Bytedance Seed	9.0	7.9	$0.234	2/3	10.2s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.234 প্রতিক্রিয়া সময় (গড়) 10.2s
#42	GLM 5.2 medium	Z.ai	8.2	7.8	$0.187	2/3	13.1s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.187 প্রতিক্রিয়া সময় (গড়) 13.1s
#43	GPT-5.6 Terra medium	OpenAI	8.4	7.8	$0.676	2/3	3.78s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.676 প্রতিক্রিয়া সময় (গড়) 3.78s
#47	Claude Opus 4.6 medium	Anthropic	7.7	7.7	$3.059	2/3	4.71s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $3.059 প্রতিক্রিয়া সময় (গড়) 4.71s
#48	GPT-5.6 Luna high	OpenAI	7.6	7.7	$1.017	2/3	14.6s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $1.017 প্রতিক্রিয়া সময় (গড়) 14.6s
#49	DeepSeek V4 Flash high	DeepSeek	8.2	7.7	$0.041	2/3	26.1s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.041 প্রতিক্রিয়া সময় (গড়) 26.1s
#51	MiniMax M3 medium	Minimax	7.9	7.6	$0.286	2/3	49.9s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.286 প্রতিক্রিয়া সময় (গড়) 49.9s
#52	Grok Build 0.1 medium	X AI	7.7	7.6	$1.097	2/3	18.3s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $1.097 প্রতিক্রিয়া সময় (গড়) 18.3s
#53	GLM 5 Turbo medium	Z.ai	8.7	7.6	$0.323	2/3	5.23s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.323 প্রতিক্রিয়া সময় (গড়) 5.23s
#54	GPT-5.6 Luna medium	OpenAI	7.8	7.6	$0.352	2/3	4.04s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.352 প্রতিক্রিয়া সময় (গড়) 4.04s

ধাঁধা সমাধান র‌্যাঙ্কিং

মডেল ফিল্টার করুন

ধাঁধা সমাধান স্কোর অনুযায়ী শীর্ষ মডেল

ধাঁধা সমাধান স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল