সাধারণ জ্ঞান মডেল র‌্যাঙ্কিং

AI BENCHY বিভাগ

দেখুন সাধারণ জ্ঞান এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↑.

দেখানো মডেল

গড় সাধারণ জ্ঞান স্কোর

3.1

সেরা মডেল

Grok 4.20 Beta 0.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ133 ব্যর্থতার কারণ API ত্রুটি সহ13 ব্যর্থতার কারণ কোন উত্তর নেই সহ8

169/169

র‍্যাঙ্ক	মডেল	কোম্পানি	সাধারণ জ্ঞান স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#24	Gemini 2.5 Flash medium	Google	3.0	8.2	$0.379	0/1	2.76s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.379 প্রতিক্রিয়া সময় (গড়) 2.76s
#117	DeepSeek V4 Flash none	DeepSeek	3.0	5.5	$0.007	0/1	3.07s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.007 প্রতিক্রিয়া সময় (গড়) 3.07s
#34	Gemini 3.1 Flash Lite medium	Google	3.0	7.8	$0.071	0/1	3.08s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.071 প্রতিক্রিয়া সময় (গড়) 3.08s
#61	GLM 5.2 none	Z.ai	3.0	7.1	$0.076	0/1	3.41s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.076 প্রতিক্রিয়া সময় (গড়) 3.41s
#57	Claude Opus 4.8 none	Anthropic	3.0	7.2	$0.539	0/1	3.41s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.539 প্রতিক্রিয়া সময় (গড়) 3.41s
#101	GLM 5 none	Z.ai	3.0	6.0	$0.027	0/1	3.62s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.027 প্রতিক্রিয়া সময় (গড়) 3.62s
#134	MiMo-V2.5 none	Xiaomi	3.0	5.1	$0.007	0/1	3.89s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.007 প্রতিক্রিয়া সময় (গড়) 3.89s
#118	Kimi K2.5 none	Moonshot AI	3.0	5.5	$0.027	0/1	3.90s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.027 প্রতিক্রিয়া সময় (গড়) 3.90s
#1	Gemini 3.5 Flash high	Google	10.0	9.8	$1.115	1/1	3.94s
মোট টেস্ট 1 ভুল টেস্ট 0 মোট খরচ $1.115 প্রতিক্রিয়া সময় (গড়) 3.94s
#120	Qwen3.6 27B none	Qwen	3.0	5.5	$0.028	0/1	4.03s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.028 প্রতিক্রিয়া সময় (গড়) 4.03s
#45	GPT-5.3 Chat none	OpenAI	3.0	7.5	$0.433	0/1	4.38s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.433 প্রতিক্রিয়া সময় (গড়) 4.38s
#55	Claude Sonnet 4.6 none	Anthropic	3.0	7.3	$0.316	0/1	4.67s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.316 প্রতিক্রিয়া সময় (গড়) 4.67s
#46	GPT-5.4 Nano medium	OpenAI	3.0	7.5	$0.107	0/1	4.81s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.107 প্রতিক্রিয়া সময় (গড়) 4.81s
#66	Gemini 3.5 Flash none	Google	2.8	7.0	$1.079	0/1	4.87s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $1.079 প্রতিক্রিয়া সময় (গড়) 4.87s
#90	GPT-5.5 none	OpenAI	3.0	6.3	$0.231	0/1	5.01s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.231 প্রতিক্রিয়া সময় (গড়) 5.01s

সাধারণ জ্ঞান র‌্যাঙ্কিং

মডেল ফিল্টার করুন

সাধারণ জ্ঞান স্কোর অনুযায়ী শীর্ষ মডেল

সাধারণ জ্ঞান স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল