عمومی ذہانت ماڈل درجہ بندی

دیکھیں کہ عمومی ذہانت میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.

دکھائے گئے ماڈلز

اوسط عمومی ذہانت اسکور

6.1

بہترین ماڈل

Qwen3.5-9B 2.8

ناکامی کی وجوہات

ناکامی کی وجہ ہدایات پر عمل نہیں کیا کے ساتھ78 ناکامی کی وجہ غلط جواب کے ساتھ59 ناکامی کی وجہ API خرابی کے ساتھ12 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ4

210/210

درجہ	ماڈل	کمپنی	عمومی ذہانت اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#19	Qwen3.6 Max Preview medium	Qwen	10.0	8.4	$1.143	1/1	32.2s
کل ٹیسٹس 1 غلط ٹیسٹس 0 کل لاگت $1.143 ردِعمل کا وقت (اوسط) 32.2s
#119	Qwen3.5-35B-A3B medium	Qwen	2.8	6.2	$0.837	0/1	30.3s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.837 ردِعمل کا وقت (اوسط) 30.3s
#95	Gemma 4 26B A4B medium	Google	10.0	6.6	$0.089	1/1	29.8s
کل ٹیسٹس 1 غلط ٹیسٹس 0 کل لاگت $0.089 ردِعمل کا وقت (اوسط) 29.8s
#37	Qwen3.6 Plus medium	Qwen	5.1	7.8	$0.405	0/1	27.1s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.405 ردِعمل کا وقت (اوسط) 27.1s
#36	Qwen3.7 Plus medium	Qwen	10.0	7.9	$0.267	1/1	25.5s
کل ٹیسٹس 1 غلط ٹیسٹس 0 کل لاگت $0.267 ردِعمل کا وقت (اوسط) 25.5s
#70	Qwen3.5 Plus 2026-04-20 medium	Qwen	4.9	7.2	$0.317	0/1	25.3s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.317 ردِعمل کا وقت (اوسط) 25.3s
#45	DeepSeek V4 Flash high	DeepSeek	6.1	7.7	$0.042	0/1	25.2s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.042 ردِعمل کا وقت (اوسط) 25.2s
#137	North Mini Code medium	Cohere	5.1	5.9	$0.000	0/1	25.1s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 25.1s
#73	Grok 4.3 medium	X AI	5.4	7.1	$0.779	0/1	24.7s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.779 ردِعمل کا وقت (اوسط) 24.7s
#75	Grok 4.20 medium	X AI	3.9	7.1	$0.777	0/1	24.5s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.777 ردِعمل کا وقت (اوسط) 24.5s
#150	DeepSeek V4 Flash none	DeepSeek	4.2	5.6	$0.044	0/1	23.7s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.044 ردِعمل کا وقت (اوسط) 23.7s
#188	Cobuddy medium	Baidu	4.2	4.7	$0.000	0/1	23.2s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 23.2s
#91	LongCat 2.0 low	Meituan	3.4	6.7	$0.391	0/1	22.5s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.391 ردِعمل کا وقت (اوسط) 22.5s
#130	Step 3.5 Flash medium	Stepfun	5.5	6.0	$0.108	0/1	22.4s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.108 ردِعمل کا وقت (اوسط) 22.4s
#74	GLM 5.1 medium	Z.ai	10.0	7.1	$0.535	1/1	20.9s
کل ٹیسٹس 1 غلط ٹیسٹس 0 کل لاگت $0.535 ردِعمل کا وقت (اوسط) 20.9s

عمومی ذہانت درجہ بندی

ماڈلز فلٹر کریں

عمومی ذہانت اسکور کے لحاظ سے سرفہرست ماڈلز

عمومی ذہانت اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز