সাধারণ জ্ঞান মডেল র‌্যাঙ্কিং

AI BENCHY বিভাগ

দেখুন সাধারণ জ্ঞান এ কোন AI মডেল সবচেয়ে ভালো করে, কোনগুলো নির্ভরযোগ্য থাকে, আর সবচেয়ে বড় পার্থক্য কোথায় দেখা যায়। সাজান: সঠিক টেস্ট ↓.

দেখানো মডেল

গড় সাধারণ জ্ঞান স্কোর

3.1

সেরা মডেল

Gemini 3.5 Flash 10.0

ব্যর্থতার কারণ

ব্যর্থতার কারণ ভুল উত্তর সহ133 ব্যর্থতার কারণ API ত্রুটি সহ13 ব্যর্থতার কারণ কোন উত্তর নেই সহ8

169/169

র‍্যাঙ্ক	মডেল	কোম্পানি	সাধারণ জ্ঞান স্কোর	স্কোর	মোট খরচ	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)
#1	Gemini 3.5 Flash high	Google	10.0	9.8	$1.115	1/1	3.94s
মোট টেস্ট 1 ভুল টেস্ট 0 মোট খরচ $1.115 প্রতিক্রিয়া সময় (গড়) 3.94s
#2	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.667	1/1	5.50s
মোট টেস্ট 1 ভুল টেস্ট 0 মোট খরচ $0.667 প্রতিক্রিয়া সময় (গড়) 5.50s
#5	Gemini 3.5 Flash low	Google	10.0	9.2	$0.349	1/1	1.88s
মোট টেস্ট 1 ভুল টেস্ট 0 মোট খরচ $0.349 প্রতিক্রিয়া সময় (গড়) 1.88s
#7	Gemini 3.1 Pro Preview medium	Google	10.0	9.2	$1.054	1/1	6.27s
মোট টেস্ট 1 ভুল টেস্ট 0 মোট খরচ $1.054 প্রতিক্রিয়া সময় (গড়) 6.27s
#8	Gemini 3.5 Flash medium	Google	10.0	9.1	$0.582	1/1	2.75s
মোট টেস্ট 1 ভুল টেস্ট 0 মোট খরচ $0.582 প্রতিক্রিয়া সময় (গড়) 2.75s
#52	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.111	1/1	2.75s
মোট টেস্ট 1 ভুল টেস্ট 0 মোট খরচ $0.111 প্রতিক্রিয়া সময় (গড়) 2.75s
#3	Qwen3.7 Max medium	Qwen	3.0	9.4	$0.523	0/1	33.4s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.523 প্রতিক্রিয়া সময় (গড়) 33.4s
#4	GPT-5.5 low	OpenAI	3.0	9.3	$0.907	0/1	10.1s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.907 প্রতিক্রিয়া সময় (গড়) 10.1s
#6	Claude Fable 5 medium	Anthropic	3.0	9.2	$3.165	0/1	25.6s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $3.165 প্রতিক্রিয়া সময় (গড়) 25.6s
#9	GPT-5.5 medium	OpenAI	2.8	9.0	$3.679	0/1	37.9s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $3.679 প্রতিক্রিয়া সময় (গড়) 37.9s
#10	GPT-5.3-Codex medium	OpenAI	2.8	8.9	$0.740	0/1	14.4s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.740 প্রতিক্রিয়া সময় (গড়) 14.4s
#11	Qwen3.6 Max Preview medium	Qwen	3.0	8.9	$0.960	0/1	60.6s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.960 প্রতিক্রিয়া সময় (গড়) 60.6s
#12	Claude Opus 4.8 medium	Anthropic	3.0	8.8	$1.107	0/1	6.14s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $1.107 প্রতিক্রিয়া সময় (গড়) 6.14s
#13	Claude Opus 4.7 medium	Anthropic	3.0	8.7	$0.679	0/1	2.25s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.679 প্রতিক্রিয়া সময় (গড়) 2.25s
#14	GLM 5.2 medium	Z.ai	3.0	8.7	$0.324	0/1	34.2s
মোট টেস্ট 1 ভুল টেস্ট 1 মোট খরচ $0.324 প্রতিক্রিয়া সময় (গড়) 34.2s

1 2 12

→

সাধারণ জ্ঞান র‌্যাঙ্কিং

মডেল ফিল্টার করুন

সাধারণ জ্ঞান স্কোর অনুযায়ী শীর্ষ মডেল

সাধারণ জ্ঞান স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল