সাধারণ জ্ঞান মডেল র‌্যাঙ্কিং

AI BENCHY বিভাগ

দেখুন সাধারণ জ্ঞান এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: সঠিক টেস্ট ↑.

দেখানো মডেল

গড় সাধারণ জ্ঞান স্কোর

3.1

সেরা মডেল

Qwen3.7 Max 3.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ133 ব্যর্থতার কারণ API ত্রুটি সহ13 ব্যর্থতার কারণ কোন উত্তর নেই সহ8

169/169

র‍্যাঙ্ক	মডেল	কোম্পানি	সাধারণ জ্ঞান স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#51	MiMo-V2.5-Pro medium	Xiaomi	3.0	7.4	$0.106	0/1	12.5s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.106 প্রতিক্রিয়া সময় (গড়) 12.5s
#53	Grok 4.20 medium	X AI	3.0	7.3	$0.609	0/1	63.5s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.609 প্রতিক্রিয়া সময় (গড়) 63.5s
#54	Hy3 preview medium	Tencent	3.0	7.3	$0.021	0/1	39.9s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.021 প্রতিক্রিয়া সময় (গড়) 39.9s
#55	Claude Sonnet 4.6 none	Anthropic	3.0	7.3	$0.316	0/1	4.67s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.316 প্রতিক্রিয়া সময় (গড়) 4.67s
#56	GLM 5V Turbo medium	Z.ai	3.0	7.3	$0.457	0/1	41.0s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.457 প্রতিক্রিয়া সময় (গড়) 41.0s
#57	Claude Opus 4.8 none	Anthropic	3.0	7.2	$0.539	0/1	3.41s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.539 প্রতিক্রিয়া সময় (গড়) 3.41s
#58	DeepSeek V4 Pro none	DeepSeek	3.0	7.2	$0.034	0/1	5.76s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.034 প্রতিক্রিয়া সময় (গড়) 5.76s
#59	Gemma 4 26B A4B medium	Google	3.0	7.2	$0.045	0/1	180.9s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.045 প্রতিক্রিয়া সময় (গড়) 180.9s
#60	Qwen3.7 Plus none	Qwen	3.0	7.2	$0.023	0/1	1.21s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.023 প্রতিক্রিয়া সময় (গড়) 1.21s
#61	GLM 5.2 none	Z.ai	3.0	7.1	$0.076	0/1	3.41s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.076 প্রতিক্রিয়া সময় (গড়) 3.41s
#62	MiMo-V2-Flash medium	Xiaomi	3.0	7.1	$0.043	0/1	1.96s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.043 প্রতিক্রিয়া সময় (গড়) 1.96s
#63	Step 3.7 Flash high	Stepfun	3.0	7.1	$1.148	0/1	149.3s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $1.148 প্রতিক্রিয়া সময় (গড়) 149.3s
#64	GLM 5.1 medium	Z.ai	3.0	7.1	$0.292	0/1	29.4s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.292 প্রতিক্রিয়া সময় (গড়) 29.4s
#65	Kimi K2.7 Code medium	Moonshot AI	3.0	7.0	$0.583	0/1	341.8s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.583 প্রতিক্রিয়া সময় (গড়) 341.8s
#66	Gemini 3.5 Flash none	Google	2.8	7.0	$1.079	0/1	4.87s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $1.079 প্রতিক্রিয়া সময় (গড়) 4.87s

সাধারণ জ্ঞান র‌্যাঙ্কিং

মডেল ফিল্টার করুন

সাধারণ জ্ঞান স্কোর অনুযায়ী শীর্ষ মডেল

সাধারণ জ্ঞান স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল