عمومی ذہانت ماڈل درجہ بندی

دیکھیں کہ عمومی ذہانت میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: میٹرک ↑.

دکھائے گئے ماڈلز

اوسط عمومی ذہانت اسکور

6.1

بہترین ماڈل

Qwen3.5-35B-A3B 2.8

ناکامی کی وجوہات

ناکامی کی وجہ ہدایات پر عمل نہیں کیا کے ساتھ78 ناکامی کی وجہ غلط جواب کے ساتھ59 ناکامی کی وجہ API خرابی کے ساتھ12 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ4

210/210

درجہ	ماڈل	کمپنی	عمومی ذہانت اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#154	MiMo-V2.5-Pro none	Xiaomi	4.0	5.5	$0.068	0/1	2.58s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.068 ردِعمل کا وقت (اوسط) 2.58s
#156	Gemma 4 26B A4B none	Google	4.0	5.5	$0.015	0/1	3.54s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.015 ردِعمل کا وقت (اوسط) 3.54s
#165	Mistral Small 4 none	Mistral	4.0	5.1	$0.022	0/1	729ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.022 ردِعمل کا وقت (اوسط) 729ms
#174	GPT-4o-mini none	OpenAI	4.0	5.0	$0.010	0/1	909ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.010 ردِعمل کا وقت (اوسط) 909ms
#176	GLM 4.7 Flash none	Z.ai	4.0	4.9	$0.016	0/1	1.59s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.016 ردِعمل کا وقت (اوسط) 1.59s
#178	Ling-2.6-flash none	Inclusionai	4.0	4.9	$0.002	0/1	1.45s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.002 ردِعمل کا وقت (اوسط) 1.45s
#193	Elephant Alpha none	Openrouter	4.0	4.3	$0.000	0/1	854ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 854ms
#201	Granite 4.1 8B none	IBM Granite	4.0	4.0	$0.007	0/1	499ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.007 ردِعمل کا وقت (اوسط) 499ms
#209	Step 3.5 Flash none	Stepfun	4.0	2.3	$0.020	0/1	14.4s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.020 ردِعمل کا وقت (اوسط) 14.4s
#210	LFM2-24B-A2B none	Liquid	4.0	2.2	$0.001	0/1	395ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.001 ردِعمل کا وقت (اوسط) 395ms
#62	KAT-Coder-Pro V2.5 low	Kwaipilot	4.1	7.4	$0.387	0/1	2.32s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.387 ردِعمل کا وقت (اوسط) 2.32s
#108	Ring-2.6-1T medium	Inclusionai	4.1	6.3	$0.103	0/1	58.3s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.103 ردِعمل کا وقت (اوسط) 58.3s
#128	GPT-5 Nano medium	OpenAI	4.1	6.1	$0.114	0/1	17.5s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.114 ردِعمل کا وقت (اوسط) 17.5s
#140	Nemotron 3 Super medium	NVIDIA	4.1	5.7	$0.050	0/1	6.91s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.050 ردِعمل کا وقت (اوسط) 6.91s
#157	Mimo V2 Omni none	Xiaomi	4.1	5.5	$0.021	0/1	2.33s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.021 ردِعمل کا وقت (اوسط) 2.33s

عمومی ذہانت درجہ بندی

ماڈلز فلٹر کریں

عمومی ذہانت اسکور کے لحاظ سے سرفہرست ماڈلز

عمومی ذہانت اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز