সাধারণ জ্ঞান মডেল র‌্যাঙ্কিং

AI BENCHY বিভাগ

দেখুন সাধারণ জ্ঞান এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: প্রতিক্রিয়া সময় (গড়) ↓.

দেখানো মডেল

গড় সাধারণ জ্ঞান স্কোর

3.1

সেরা মডেল

Kimi K2.7 Code 3.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ133 ব্যর্থতার কারণ API ত্রুটি সহ13 ব্যর্থতার কারণ কোন উত্তর নেই সহ8

169/169

র‍্যাঙ্ক	মডেল	কোম্পানি	সাধারণ জ্ঞান স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#12	Claude Opus 4.8 medium	Anthropic	3.0	8.8	$1.107	0/1	6.14s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $1.107 প্রতিক্রিয়া সময় (গড়) 6.14s
#133	Mistral Small 4 medium	Mistral	3.0	5.1	$0.068	0/1	5.92s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.068 প্রতিক্রিয়া সময় (গড়) 5.92s
#58	DeepSeek V4 Pro none	DeepSeek	3.0	7.2	$0.034	0/1	5.76s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.034 প্রতিক্রিয়া সময় (গড়) 5.76s
#2	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.667	1/1	5.50s
মোট টেস্ট 1 ভুল টেস্ট 0 মোট খরচ $0.667 প্রতিক্রিয়া সময় (গড়) 5.50s
#90	GPT-5.5 none	OpenAI	3.0	6.3	$0.231	0/1	5.01s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.231 প্রতিক্রিয়া সময় (গড়) 5.01s
#66	Gemini 3.5 Flash none	Google	2.8	7.0	$1.079	0/1	4.87s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $1.079 প্রতিক্রিয়া সময় (গড়) 4.87s
#46	GPT-5.4 Nano medium	OpenAI	3.0	7.5	$0.107	0/1	4.81s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.107 প্রতিক্রিয়া সময় (গড়) 4.81s
#55	Claude Sonnet 4.6 none	Anthropic	3.0	7.3	$0.316	0/1	4.67s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.316 প্রতিক্রিয়া সময় (গড়) 4.67s
#45	GPT-5.3 Chat none	OpenAI	3.0	7.5	$0.433	0/1	4.38s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.433 প্রতিক্রিয়া সময় (গড়) 4.38s
#120	Qwen3.6 27B none	Qwen	3.0	5.5	$0.028	0/1	4.03s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.028 প্রতিক্রিয়া সময় (গড়) 4.03s
#1	Gemini 3.5 Flash high	Google	10.0	9.8	$1.115	1/1	3.94s
মোট টেস্ট 1 ভুল টেস্ট 0 মোট খরচ $1.115 প্রতিক্রিয়া সময় (গড়) 3.94s
#118	Kimi K2.5 none	Moonshot AI	3.0	5.5	$0.027	0/1	3.90s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.027 প্রতিক্রিয়া সময় (গড়) 3.90s
#134	MiMo-V2.5 none	Xiaomi	3.0	5.1	$0.007	0/1	3.89s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.007 প্রতিক্রিয়া সময় (গড়) 3.89s
#101	GLM 5 none	Z.ai	3.0	6.0	$0.027	0/1	3.62s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.027 প্রতিক্রিয়া সময় (গড়) 3.62s
#57	Claude Opus 4.8 none	Anthropic	3.0	7.2	$0.539	0/1	3.41s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.539 প্রতিক্রিয়া সময় (গড়) 3.41s

সাধারণ জ্ঞান র‌্যাঙ্কিং

মডেল ফিল্টার করুন

সাধারণ জ্ঞান স্কোর অনুযায়ী শীর্ষ মডেল

সাধারণ জ্ঞান স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল