সাধারণ জ্ঞান মডেল র‌্যাঙ্কিং

AI BENCHY বিভাগ

দেখুন সাধারণ জ্ঞান এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়।

দেখানো মডেল

গড় সাধারণ জ্ঞান স্কোর

3.1

সেরা মডেল

Gemini 3.5 Flash 10.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ133 ব্যর্থতার কারণ API ত্রুটি সহ13 ব্যর্থতার কারণ কোন উত্তর নেই সহ8

169/169

র‍্যাঙ্ক	মডেল	কোম্পানি	সাধারণ জ্ঞান স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#162	Laguna Xs.2 none	Poolside	3.0	4.0	$0.000	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 0ms
#163	Granite 4.1 8B none	IBM Granite	3.0	4.0	$0.003	0/1	306ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.003 প্রতিক্রিয়া সময় (গড়) 306ms
#164	gpt-oss-120b none	OpenAI	3.0	4.0	$0.010	0/1	47.3s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.010 প্রতিক্রিয়া সময় (গড়) 47.3s
#165	Qwen3.5-9B medium	Qwen	3.0	3.8	$0.036	0/1	177.0s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.036 প্রতিক্রিয়া সময় (গড়) 177.0s
#166	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	3.0	3.6	$0.000	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 0ms
#167	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.0	3.5	$0.000	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 0ms
#168	Step 3.5 Flash none	Stepfun	3.0	2.6	$0.020	0/1	114.1s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.020 প্রতিক্রিয়া সময় (গড়) 114.1s
#9	GPT-5.5 medium	OpenAI	2.8	9.0	$3.679	0/1	37.9s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $3.679 প্রতিক্রিয়া সময় (গড়) 37.9s
#10	GPT-5.3-Codex medium	OpenAI	2.8	8.9	$0.740	0/1	14.4s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.740 প্রতিক্রিয়া সময় (গড়) 14.4s
#66	Gemini 3.5 Flash none	Google	2.8	7.0	$1.079	0/1	4.87s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $1.079 প্রতিক্রিয়া সময় (গড়) 4.87s
#69	Grok 4.20 Beta medium	X AI	0.0	6.8	$0.750	0/0	0ms
মোট টেস্ট 0 ভুল টেস্ট 0 মোট খরচ $0.750 প্রতিক্রিয়া সময় (গড়) 0ms
#83	Gemini 3.1 Flash Lite high	Google	0.0	6.5	$2.044	0/0	0ms
মোট টেস্ট 0 ভুল টেস্ট 0 মোট খরচ $2.044 প্রতিক্রিয়া সময় (গড়) 0ms
#95	Gemini 3.1 Flash Lite Preview high	Google	0.0	6.1	$2.310	0/0	0ms
মোট টেস্ট 0 ভুল টেস্ট 0 মোট খরচ $2.310 প্রতিক্রিয়া সময় (গড়) 0ms
#132	Hunter Alpha medium	OpenRouter	0.0	5.1	$0.000	0/0	0ms
মোট টেস্ট 0 ভুল টেস্ট 0 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 0ms
#136	Grok 4.20 Multi Agent Beta medium	X AI	0.0	5.0	$5.599	0/0	0ms
মোট টেস্ট 0 ভুল টেস্ট 0 মোট খরচ $5.599 প্রতিক্রিয়া সময় (গড়) 0ms

সাধারণ জ্ঞান র‌্যাঙ্কিং

মডেল ফিল্টার করুন

সাধারণ জ্ঞান স্কোর অনুযায়ী শীর্ষ মডেল

সাধারণ জ্ঞান স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল