ধাঁধা সমাধান মডেল র‌্যাঙ্কিং

দেখুন ধাঁধা সমাধান এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: সঠিক টেস্ট ↑.

দেখানো মডেল

গড় ধাঁধা সমাধান স্কোর

6.7

সেরা মডেল

GPT-5.4 Nano 4.1

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ204 ব্যর্থতার কারণ নির্দেশনা অনুসরণ করা হয়নি সহ90 ব্যর্থতার কারণ API ত্রুটি সহ12 ব্যর্থতার কারণ অতিরিক্ত ফরম্যাটিং সহ8 ব্যর্থতার কারণ টাইমআউট সহ5 ব্যর্থতার কারণ কোন উত্তর নেই সহ3

216/216

র‍্যাঙ্ক	মডেল	কোম্পানি	ধাঁধা সমাধান স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#204	Laguna Xs.2 medium	Poolside	5.3	4.1	$0.015	1/3	1.93s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.015 প্রতিক্রিয়া সময় (গড়) 1.93s
#206	MiMo-V2-Flash none	Xiaomi	5.3	4.0	$0.025	1/3	1.86s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.025 প্রতিক্রিয়া সময় (গড়) 1.86s
#208	Grok Build 0.1 none	X AI	6.4	4.0	$0.547	1/3	9.55s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.547 প্রতিক্রিয়া সময় (গড়) 9.55s
#211	Laguna Xs.2 none	Poolside	5.3	3.8	$0.004	1/3	650ms
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.004 প্রতিক্রিয়া সময় (গড়) 650ms
#212	gpt-oss-120b none	OpenAI	6.0	3.7	$0.010	1/3	8.21s
মোট টেস্ট 3 ভুল টেস্ট 2 মোট খরচ $0.010 প্রতিক্রিয়া সময় (গড়) 8.21s
#5	GPT-5.6 Sol low	OpenAI	8.2	9.5	$0.971	2/3	3.44s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.971 প্রতিক্রিয়া সময় (গড়) 3.44s
#7	GPT-5.6 Sol medium	OpenAI	8.2	9.4	$1.316	2/3	2.98s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $1.316 প্রতিক্রিয়া সময় (গড়) 2.98s
#12	Gemini 3.5 Flash medium	Google	7.7	9.1	$0.642	2/3	2.38s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.642 প্রতিক্রিয়া সময় (গড়) 2.38s
#16	GPT-5.3-Codex medium	OpenAI	9.0	8.9	$0.920	2/3	5.05s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.920 প্রতিক্রিয়া সময় (গড়) 5.05s
#19	Muse Spark 1.1 medium	Meta	7.9	8.6	$1.357	2/3	42.5s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $1.357 প্রতিক্রিয়া সময় (গড়) 42.5s
#20	Claude Fable 5 medium	Anthropic	7.7	8.6	$3.478	2/3	5.18s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $3.478 প্রতিক্রিয়া সময় (গড়) 5.18s
#21	GPT-5.4 medium	OpenAI	8.2	8.5	$1.533	2/3	9.14s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $1.533 প্রতিক্রিয়া সময় (গড়) 9.14s
#24	GPT-5.2 medium	OpenAI	7.5	8.4	$0.951	2/3	5.80s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.951 প্রতিক্রিয়া সময় (গড়) 5.80s
#26	Claude Sonnet 5 medium	Anthropic	7.7	8.3	$0.922	2/3	2.98s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.922 প্রতিক্রিয়া সময় (গড়) 2.98s
#27	Muse Spark 1.1 low	Meta	8.3	8.3	$0.647	2/3	6.60s
মোট টেস্ট 3 ভুল টেস্ট 1 মোট খরচ $0.647 প্রতিক্রিয়া সময় (গড়) 6.60s

ধাঁধা সমাধান র‌্যাঙ্কিং

মডেল ফিল্টার করুন

ধাঁধা সমাধান স্কোর অনুযায়ী শীর্ষ মডেল

ধাঁধা সমাধান স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল