عمومی ذہانت ماڈل درجہ بندی

دیکھیں کہ عمومی ذہانت میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: درست ٹیسٹس ↑.

دکھائے گئے ماڈلز

اوسط عمومی ذہانت اسکور

6.1

بہترین ماڈل

Grok 4.5 4.7

ناکامی کی وجوہات

ناکامی کی وجہ ہدایات پر عمل نہیں کیا کے ساتھ78 ناکامی کی وجہ غلط جواب کے ساتھ62 ناکامی کی وجہ API خرابی کے ساتھ12 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ4

216/216

درجہ	ماڈل	کمپنی	عمومی ذہانت اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#211	Laguna Xs.2 none	Poolside	3.0	3.8	$0.004	0/1	0ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.004 ردِعمل کا وقت (اوسط) 0ms
#212	gpt-oss-120b none	OpenAI	4.8	3.7	$0.010	0/1	10.8s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.010 ردِعمل کا وقت (اوسط) 10.8s
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	3.0	3.4	$0.000	0/1	0ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 0ms
#214	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.0	3.2	$0.000	0/1	0ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 0ms
#215	Step 3.5 Flash none	Stepfun	4.0	2.3	$0.020	0/1	14.4s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.020 ردِعمل کا وقت (اوسط) 14.4s
#216	LFM2-24B-A2B none	Liquid	4.0	2.2	$0.001	0/1	395ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.001 ردِعمل کا وقت (اوسط) 395ms
#1	Gemini 3.6 Flash medium	Google	10.0	9.9	$0.831	1/1	3.32s
کل ٹیسٹس 1 غلط ٹیسٹس 0 کل لاگت $0.831 ردِعمل کا وقت (اوسط) 3.32s
#2	Gemini 3.6 Flash high	Google	10.0	9.7	$1.785	1/1	3.35s
کل ٹیسٹس 1 غلط ٹیسٹس 0 کل لاگت $1.785 ردِعمل کا وقت (اوسط) 3.35s
#3	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.742	1/1	5.19s
کل ٹیسٹس 1 غلط ٹیسٹس 0 کل لاگت $0.742 ردِعمل کا وقت (اوسط) 5.19s
#4	Gemini 3.5 Flash high	Google	10.0	9.5	$1.976	1/1	3.63s
کل ٹیسٹس 1 غلط ٹیسٹس 0 کل لاگت $1.976 ردِعمل کا وقت (اوسط) 3.63s
#5	GPT-5.6 Sol low	OpenAI	10.0	9.5	$0.971	1/1	3.07s
کل ٹیسٹس 1 غلط ٹیسٹس 0 کل لاگت $0.971 ردِعمل کا وقت (اوسط) 3.07s
#6	Gemini 3.6 Flash low	Google	10.0	9.4	$0.517	1/1	2.56s
کل ٹیسٹس 1 غلط ٹیسٹس 0 کل لاگت $0.517 ردِعمل کا وقت (اوسط) 2.56s
#7	GPT-5.6 Sol medium	OpenAI	10.0	9.4	$1.316	1/1	3.48s
کل ٹیسٹس 1 غلط ٹیسٹس 0 کل لاگت $1.316 ردِعمل کا وقت (اوسط) 3.48s
#8	GPT-5.6 Sol high	OpenAI	10.0	9.4	$1.234	1/1	4.40s
کل ٹیسٹس 1 غلط ٹیسٹس 0 کل لاگت $1.234 ردِعمل کا وقت (اوسط) 4.40s
#9	GPT-5.5 low	OpenAI	10.0	9.3	$1.253	1/1	5.17s
کل ٹیسٹس 1 غلط ٹیسٹس 0 کل لاگت $1.253 ردِعمل کا وقت (اوسط) 5.17s

عمومی ذہانت درجہ بندی

ماڈلز فلٹر کریں

عمومی ذہانت اسکور کے لحاظ سے سرفہرست ماڈلز

عمومی ذہانت اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز