সাধারণ জ্ঞান মডেল র‌্যাঙ্কিং

AI BENCHY বিভাগ

দেখুন সাধারণ জ্ঞান এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↑.

দেখানো মডেল

গড় সাধারণ জ্ঞান স্কোর

3.1

সেরা মডেল

Grok 4.20 Beta 0.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ133 ব্যর্থতার কারণ API ত্রুটি সহ13 ব্যর্থতার কারণ কোন উত্তর নেই সহ8

169/169

র‍্যাঙ্ক	মডেল	কোম্পানি	সাধারণ জ্ঞান স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#25	Qwen3.7 Plus medium	Qwen	3.0	8.2	$0.177	0/1	91.1s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.177 প্রতিক্রিয়া সময় (গড়) 91.1s
#33	Qwen3.5 Plus 2026-04-20 medium	Qwen	3.0	7.8	$0.317	0/1	92.6s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.317 প্রতিক্রিয়া সময় (গড়) 92.6s
#40	MiniMax M3 medium	Minimax	3.0	7.6	$0.131	0/1	100.8s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.131 প্রতিক্রিয়া সময় (গড়) 100.8s
#28	Qwen3.5 Plus 2026-02-15 medium	Qwen	3.0	8.0	$0.310	0/1	103.8s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.310 প্রতিক্রিয়া সময় (গড়) 103.8s
#80	Step 3.5 Flash medium	Stepfun	3.0	6.6	$0.070	0/1	108.4s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.070 প্রতিক্রিয়া সময় (গড়) 108.4s
#72	Ring-2.6-1T medium	Inclusionai	3.0	6.8	$0.033	0/1	113.9s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.033 প্রতিক্রিয়া সময় (গড়) 113.9s
#20	Step 3.7 Flash medium	Stepfun	3.0	8.5	$0.376	0/1	114.0s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.376 প্রতিক্রিয়া সময় (গড়) 114.0s
#168	Step 3.5 Flash none	Stepfun	3.0	2.6	$0.020	0/1	114.1s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.020 প্রতিক্রিয়া সময় (গড়) 114.1s
#47	Qwen3.6 Flash medium	Qwen	3.0	7.5	$0.288	0/1	122.9s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.288 প্রতিক্রিয়া সময় (গড়) 122.9s
#39	Step 3.7 Flash low	Stepfun	3.0	7.7	$0.341	0/1	124.8s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.341 প্রতিক্রিয়া সময় (গড়) 124.8s
#35	Kimi K2.6 medium	Moonshot AI	3.0	7.8	$0.889	0/1	130.3s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.889 প্রতিক্রিয়া সময় (গড়) 130.3s
#144	Ring-2.6-1T none	Inclusionai	3.0	4.8	$0.026	0/1	133.6s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.026 প্রতিক্রিয়া সময় (গড়) 133.6s
#63	Step 3.7 Flash high	Stepfun	3.0	7.1	$1.148	0/1	149.3s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $1.148 প্রতিক্রিয়া সময় (গড়) 149.3s
#165	Qwen3.5-9B medium	Qwen	3.0	3.8	$0.036	0/1	177.0s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.036 প্রতিক্রিয়া সময় (গড়) 177.0s
#89	Qwen3.5-35B-A3B medium	Qwen	3.0	6.3	$0.401	0/1	177.4s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.401 প্রতিক্রিয়া সময় (গড়) 177.4s

সাধারণ জ্ঞান র‌্যাঙ্কিং

মডেল ফিল্টার করুন

সাধারণ জ্ঞান স্কোর অনুযায়ী শীর্ষ মডেল

সাধারণ জ্ঞান স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল