সাধারণ জ্ঞান মডেল র‌্যাঙ্কিং

AI BENCHY বিভাগ

দেখুন সাধারণ জ্ঞান এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: মেট্রিক ↑.

দেখানো মডেল

গড় সাধারণ জ্ঞান স্কোর

3.1

সেরা মডেল

Grok 4.20 Beta 0.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ133 ব্যর্থতার কারণ API ত্রুটি সহ13 ব্যর্থতার কারণ কোন উত্তর নেই সহ8

169/169

র‍্যাঙ্ক	মডেল	কোম্পানি	সাধারণ জ্ঞান স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#90	GPT-5.5 none	OpenAI	3.0	6.3	$0.231	0/1	5.01s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.231 প্রতিক্রিয়া সময় (গড়) 5.01s
#91	Gemini 3 PRO Preview medium	Google	3.0	6.2	$0.385	0/1	0ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.385 প্রতিক্রিয়া সময় (গড়) 0ms
#92	Seed-2.0-Lite none	Bytedance Seed	3.0	6.2	$0.019	0/1	1.96s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.019 প্রতিক্রিয়া সময় (গড়) 1.96s
#93	Gemini 2.5 Flash none	Google	3.0	6.2	$0.016	0/1	1.15s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.016 প্রতিক্রিয়া সময় (গড়) 1.15s
#94	Gemini 3.1 Flash Lite minimal	Google	3.0	6.1	$0.013	0/1	724ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.013 প্রতিক্রিয়া সময় (গড়) 724ms
#96	Gemini 3.1 Flash Lite none	Google	3.0	6.1	$0.013	0/1	733ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.013 প্রতিক্রিয়া সময় (গড়) 733ms
#97	Qwen3.5-Flash none	Qwen	3.0	6.1	$0.005	0/1	588ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.005 প্রতিক্রিয়া সময় (গড়) 588ms
#98	Gemma 4 31B none	Google	3.0	6.1	$0.004	0/1	1.25s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.004 প্রতিক্রিয়া সময় (গড়) 1.25s
#99	Nemotron 3 Ultra 550b A55b none	NVIDIA	3.0	6.1	$0.027	0/1	1.83s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.027 প্রতিক্রিয়া সময় (গড়) 1.83s
#100	Qwen3.6 Max Preview none	Qwen	3.0	6.0	$0.075	0/1	1.97s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.075 প্রতিক্রিয়া সময় (গড়) 1.97s
#101	GLM 5 none	Z.ai	3.0	6.0	$0.027	0/1	3.62s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.027 প্রতিক্রিয়া সময় (গড়) 3.62s
#102	Qwen3.6 Flash none	Qwen	3.0	6.0	$0.015	0/1	649ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.015 প্রতিক্রিয়া সময় (গড়) 649ms
#103	Qwen3.5-35B-A3B none	Qwen	3.0	5.9	$0.012	0/1	493ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.012 প্রতিক্রিয়া সময় (গড়) 493ms
#104	Qwen3.5-27B none	Qwen	3.0	5.9	$0.015	0/1	599ms
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.015 প্রতিক্রিয়া সময় (গড়) 599ms
#105	GLM 5V Turbo none	Z.ai	3.0	5.9	$0.052	0/1	2.23s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.052 প্রতিক্রিয়া সময় (গড়) 2.23s

সাধারণ জ্ঞান র‌্যাঙ্কিং

মডেল ফিল্টার করুন

সাধারণ জ্ঞান স্কোর অনুযায়ী শীর্ষ মডেল

সাধারণ জ্ঞান স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল