সাধারণ জ্ঞান মডেল র‌্যাঙ্কিং

AI BENCHY বিভাগ

দেখুন সাধারণ জ্ঞান এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↑.

দেখানো মডেল

গড় সাধারণ জ্ঞান স্কোর

3.1

সেরা মডেল

Grok 4.20 Beta 0.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ133 ব্যর্থতার কারণ API ত্রুটি সহ13 ব্যর্থতার কারণ কোন উত্তর নেই সহ8

169/169

র‍্যাঙ্ক	মডেল	কোম্পানি	সাধারণ জ্ঞান স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#127	MiniMax M2.7 medium	Minimax	3.0	5.2	$0.104	0/1	22.8s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.104 প্রতিক্রিয়া সময় (গড়) 22.8s
#115	Grok 4.1 Fast medium	X AI	3.0	5.6	$0.069	0/1	25.5s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.069 প্রতিক্রিয়া সময় (গড়) 25.5s
#6	Claude Fable 5 medium	Anthropic	3.0	9.2	$3.165	0/1	25.6s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $3.165 প্রতিক্রিয়া সময় (গড়) 25.6s
#78	gpt-oss-120b medium	OpenAI	3.0	6.7	$0.013	0/1	26.5s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.013 প্রতিক্রিয়া সময় (গড়) 26.5s
#22	GPT-5.2 medium	OpenAI	3.0	8.4	$0.548	0/1	28.2s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.548 প্রতিক্রিয়া সময় (গড়) 28.2s
#64	GLM 5.1 medium	Z.ai	3.0	7.1	$0.292	0/1	29.4s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.292 প্রতিক্রিয়া সময় (গড়) 29.4s
#31	Claude Sonnet 4.6 medium	Anthropic	3.0	7.8	$1.418	0/1	30.1s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $1.418 প্রতিক্রিয়া সময় (গড়) 30.1s
#27	GPT-5.4 Mini medium	OpenAI	3.0	8.0	$0.526	0/1	30.1s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.526 প্রতিক্রিয়া সময় (গড়) 30.1s
#75	Qwen3.6 35B A3B medium	Qwen	3.0	6.7	$0.146	0/1	32.9s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.146 প্রতিক্রিয়া সময় (গড়) 32.9s
#122	Qwen3.5 Plus 2026-04-20 none	Qwen	3.0	5.5	$0.032	0/1	33.3s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.032 প্রতিক্রিয়া সময় (গড়) 33.3s
#3	Qwen3.7 Max medium	Qwen	3.0	9.4	$0.523	0/1	33.4s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.523 প্রতিক্রিয়া সময় (গড়) 33.4s
#41	DeepSeek V4 Pro high	DeepSeek	3.0	7.6	$0.157	0/1	34.0s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.157 প্রতিক্রিয়া সময় (গড়) 34.0s
#14	GLM 5.2 medium	Z.ai	3.0	8.7	$0.324	0/1	34.2s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.324 প্রতিক্রিয়া সময় (গড়) 34.2s
#160	Grok Build 0.1 none	X AI	3.0	4.2	$0.547	0/1	36.1s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.547 প্রতিক্রিয়া সময় (গড়) 36.1s
#140	Cobuddy medium	Baidu	3.0	4.9	$0.000	0/1	37.0s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.000 প্রতিক্রিয়া সময় (গড়) 37.0s

সাধারণ জ্ঞান র‌্যাঙ্কিং

মডেল ফিল্টার করুন

সাধারণ জ্ঞান স্কোর অনুযায়ী শীর্ষ মডেল

সাধারণ জ্ঞান স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল