সাধারণ জ্ঞান মডেল র‌্যাঙ্কিং

AI BENCHY বিভাগ

দেখুন সাধারণ জ্ঞান এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়।

দেখানো মডেল

গড় সাধারণ জ্ঞান স্কোর

3.1

সেরা মডেল

Gemini 3.5 Flash 10.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ133 ব্যর্থতার কারণ API ত্রুটি সহ13 ব্যর্থতার কারণ কোন উত্তর নেই সহ8

169/169

র‍্যাঙ্ক	মডেল	কোম্পানি	সাধারণ জ্ঞান স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#17	GPT-5.4 medium	OpenAI	3.0	8.5	$1.210	0/1	14.0s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $1.210 প্রতিক্রিয়া সময় (গড়) 14.0s
#18	Seed-2.0-Lite medium	Bytedance Seed	3.0	8.5	$0.175	0/1	48.3s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.175 প্রতিক্রিয়া সময় (গড়) 48.3s
#19	GPT-5.2 Chat none	OpenAI	3.0	8.5	$0.393	0/1	6.89s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.393 প্রতিক্রিয়া সময় (গড়) 6.89s
#20	Step 3.7 Flash medium	Stepfun	3.0	8.5	$0.376	0/1	114.0s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.376 প্রতিক্রিয়া সময় (গড়) 114.0s
#21	GLM 5 Turbo medium	Z.ai	3.0	8.4	$0.323	0/1	40.2s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.323 প্রতিক্রিয়া সময় (গড়) 40.2s
#22	GPT-5.2 medium	OpenAI	3.0	8.4	$0.548	0/1	28.2s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.548 প্রতিক্রিয়া সময় (গড়) 28.2s
#23	DeepSeek V4 Flash high	DeepSeek	3.0	8.3	$0.027	0/1	54.5s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.027 প্রতিক্রিয়া সময় (গড়) 54.5s
#24	Gemini 2.5 Flash medium	Google	3.0	8.2	$0.379	0/1	2.76s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.379 প্রতিক্রিয়া সময় (গড়) 2.76s
#25	Qwen3.7 Plus medium	Qwen	3.0	8.2	$0.177	0/1	91.1s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.177 প্রতিক্রিয়া সময় (গড়) 91.1s
#26	Nemotron 3 Ultra 550b A55b medium	NVIDIA	3.0	8.1	$0.158	0/1	38.5s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.158 প্রতিক্রিয়া সময় (গড়) 38.5s
#27	GPT-5.4 Mini medium	OpenAI	3.0	8.0	$0.526	0/1	30.1s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.526 প্রতিক্রিয়া সময় (গড়) 30.1s
#28	Qwen3.5 Plus 2026-02-15 medium	Qwen	3.0	8.0	$0.310	0/1	103.8s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.310 প্রতিক্রিয়া সময় (গড়) 103.8s
#29	Qwen3.5-27B medium	Qwen	3.0	7.9	$0.536	0/1	85.1s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.536 প্রতিক্রিয়া সময় (গড়) 85.1s
#30	Qwen3.6 Plus medium	Qwen	3.0	7.8	$0.294	0/1	47.5s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.294 প্রতিক্রিয়া সময় (গড়) 47.5s
#31	Claude Sonnet 4.6 medium	Anthropic	3.0	7.8	$1.418	0/1	30.1s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $1.418 প্রতিক্রিয়া সময় (গড়) 30.1s

সাধারণ জ্ঞান র‌্যাঙ্কিং

মডেল ফিল্টার করুন

সাধারণ জ্ঞান স্কোর অনুযায়ী শীর্ষ মডেল

সাধারণ জ্ঞান স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল