সাধারণ জ্ঞান মডেল র‌্যাঙ্কিং

AI BENCHY বিভাগ

দেখুন সাধারণ জ্ঞান এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↑.

দেখানো মডেল

গড় সাধারণ জ্ঞান স্কোর

3.1

সেরা মডেল

Grok 4.20 Beta 0.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ133 ব্যর্থতার কারণ API ত্রুটি সহ13 ব্যর্থতার কারণ কোন উত্তর নেই সহ8

169/169

র‍্যাঙ্ক	মডেল	কোম্পানি	সাধারণ জ্ঞান স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#69	Grok 4.20 Beta medium	X AI	0.0	6.8	$0.750	0/0	0ms
মোট টেস্ট 0 ভুল টেস্ট 0 মোট খরচ $0.750 প্রতিক্রিয়া সময় (গড়) 0ms
#83	Gemini 3.1 Flash Lite high	Google	0.0	6.5	$2.044	0/0	0ms
মোট টেস্ট 0 ভুল টেস্ট 0 মোট খরচ $2.044 প্রতিক্রিয়া সময় (গড়) 0ms
#91	Gemini 3 PRO Preview medium	Google	3.0	6.2	$0.385	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.385 প্রতিক্রিয়া সময় (গড়) 0ms
#95	Gemini 3.1 Flash Lite Preview high	Google	0.0	6.1	$2.310	0/0	0ms
মোট টেস্ট 0 ভুল টেস্ট 0 মোট খরচ $2.310 প্রতিক্রিয়া সময় (গড়) 0ms
#113	Qwen3.6 Plus Preview medium	Qwen	3.0	5.8	$0.000	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 0ms
#132	Hunter Alpha medium	OpenRouter	0.0	5.1	$0.000	0/0	0ms
মোট টেস্ট 0 ভুল টেস্ট 0 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 0ms
#136	Grok 4.20 Multi Agent Beta medium	X AI	0.0	5.0	$5.599	0/0	0ms
মোট টেস্ট 0 ভুল টেস্ট 0 মোট খরচ $5.599 প্রতিক্রিয়া সময় (গড়) 0ms
#138	Laguna M.1 medium	Poolside	3.0	5.0	$0.000	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 0ms
#147	Ling-2.6-1T none	Inclusionai	3.0	4.7	$0.005	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.005 প্রতিক্রিয়া সময় (গড়) 0ms
#149	Grok 4.20 Beta none	X AI	0.0	4.7	$0.087	0/0	0ms
মোট টেস্ট 0 ভুল টেস্ট 0 মোট খরচ $0.087 প্রতিক্রিয়া সময় (গড়) 0ms
#150	Laguna M.1 none	Poolside	3.0	4.6	$0.000	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 0ms
#152	Elephant Alpha none	Openrouter	3.0	4.6	$0.000	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 0ms
#153	Elephant Alpha medium	Openrouter	3.0	4.5	$0.000	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 0ms
#154	Hunter Alpha none	OpenRouter	0.0	4.5	$0.000	0/0	0ms
মোট টেস্ট 0 ভুল টেস্ট 0 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 0ms
#155	Grok 4.20 none	X AI	0.0	4.4	$0.057	0/0	0ms
মোট টেস্ট 0 ভুল টেস্ট 0 মোট খরচ $0.057 প্রতিক্রিয়া সময় (গড়) 0ms

1 2 12

→

সাধারণ জ্ঞান র‌্যাঙ্কিং

মডেল ফিল্টার করুন

সাধারণ জ্ঞান স্কোর অনুযায়ী শীর্ষ মডেল

সাধারণ জ্ঞান স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল