عمومی ذہانت ماڈل درجہ بندی

دیکھیں کہ عمومی ذہانت میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: درست ٹیسٹس ↑.

دکھائے گئے ماڈلز

اوسط عمومی ذہانت اسکور

6.1

بہترین ماڈل

Grok 4.5 4.7

ناکامی کی وجوہات

ناکامی کی وجہ ہدایات پر عمل نہیں کیا کے ساتھ78 ناکامی کی وجہ غلط جواب کے ساتھ62 ناکامی کی وجہ API خرابی کے ساتھ12 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ4

216/216

درجہ	ماڈل	کمپنی	عمومی ذہانت اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#127	gpt-oss-120b medium	OpenAI	4.3	6.1	$0.019	0/1	7.90s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.019 ردِعمل کا وقت (اوسط) 7.90s
#128	Gemini 3.1 Flash Lite none	Google	4.0	6.1	$0.046	0/1	992ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.046 ردِعمل کا وقت (اوسط) 992ms
#132	Qwen3.5 Plus 2026-04-20 none	Qwen	4.8	6.1	$0.122	0/1	1.41s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.122 ردِعمل کا وقت (اوسط) 1.41s
#133	Qwen3.5-35B-A3B none	Qwen	6.5	6.1	$0.106	0/1	1.19s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.106 ردِعمل کا وقت (اوسط) 1.19s
#134	GPT-5 Nano medium	OpenAI	4.1	6.1	$0.114	0/1	17.5s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.114 ردِعمل کا وقت (اوسط) 17.5s
#135	Nemotron 3 Ultra none	NVIDIA	5.0	6.1	$0.095	0/1	13.5s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.095 ردِعمل کا وقت (اوسط) 13.5s
#136	Step 3.5 Flash medium	Stepfun	5.5	6.0	$0.108	0/1	22.4s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.108 ردِعمل کا وقت (اوسط) 22.4s
#138	GPT-5.6 Terra none	OpenAI	5.0	6.0	$0.349	0/1	1.03s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.349 ردِعمل کا وقت (اوسط) 1.03s
#140	Mimo V2 Omni medium	Xiaomi	5.4	5.9	$0.683	0/1	3.61s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.683 ردِعمل کا وقت (اوسط) 3.61s
#141	Hy3 preview high	Tencent	3.0	5.9	$0.048	0/1	0ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.048 ردِعمل کا وقت (اوسط) 0ms
#142	GPT-5.4 Mini none	OpenAI	4.8	5.9	$0.095	0/1	1.82s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.095 ردِعمل کا وقت (اوسط) 1.82s
#143	North Mini Code medium	Cohere	5.1	5.9	$0.000	0/1	25.1s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 25.1s
#144	Kimi K2.6 none	Moonshot AI	5.4	5.8	$0.184	0/1	1.55s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.184 ردِعمل کا وقت (اوسط) 1.55s
#145	GPT-5.4 none	OpenAI	4.4	5.8	$0.397	0/1	1.78s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.397 ردِعمل کا وقت (اوسط) 1.78s
#146	Nemotron 3 Super medium	NVIDIA	4.1	5.7	$0.055	0/1	6.91s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.055 ردِعمل کا وقت (اوسط) 6.91s

عمومی ذہانت درجہ بندی

ماڈلز فلٹر کریں

عمومی ذہانت اسکور کے لحاظ سے سرفہرست ماڈلز

عمومی ذہانت اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز