عمومی ذہانت ماڈل درجہ بندی

دیکھیں کہ عمومی ذہانت میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: میٹرک ↑.

دکھائے گئے ماڈلز

اوسط عمومی ذہانت اسکور

6.1

بہترین ماڈل

Qwen3.5-35B-A3B 2.8

ناکامی کی وجوہات

ناکامی کی وجہ ہدایات پر عمل نہیں کیا کے ساتھ78 ناکامی کی وجہ غلط جواب کے ساتھ59 ناکامی کی وجہ API خرابی کے ساتھ12 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ4

210/210

درجہ	ماڈل	کمپنی	عمومی ذہانت اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#194	GLM 4.7 Flash medium	Z.ai	3.6	4.3	$0.166	0/1	18.1s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.166 ردِعمل کا وقت (اوسط) 18.1s
#51	Nemotron 3 Ultra medium	NVIDIA	3.7	7.5	$0.774	0/1	2.52s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.774 ردِعمل کا وقت (اوسط) 2.52s
#21	GPT-5.2 medium	OpenAI	3.7	8.4	$0.951	0/1	4.32s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.951 ردِعمل کا وقت (اوسط) 4.32s
#180	GPT-5.4 Nano none	OpenAI	3.8	4.8	$0.041	0/1	1.31s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.041 ردِعمل کا وقت (اوسط) 1.31s
#190	MiniMax M2.5 medium	Minimax	3.8	4.6	$0.340	0/1	6.63s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.340 ردِعمل کا وقت (اوسط) 6.63s
#171	North Mini Code none	Cohere	3.9	5.1	$0.000	0/1	34.8s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 34.8s
#172	MiniMax M2.7 medium	Minimax	3.9	5.0	$0.163	0/1	38.7s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.163 ردِعمل کا وقت (اوسط) 38.7s
#75	Grok 4.20 medium	X AI	3.9	7.1	$0.777	0/1	24.5s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.777 ردِعمل کا وقت (اوسط) 24.5s
#29	Step 3.7 Flash medium	Stepfun	4.0	8.0	$0.515	0/1	6.85s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.515 ردِعمل کا وقت (اوسط) 6.85s
#104	Gemini 3.1 Flash Lite Preview low	Google	4.0	6.5	$0.646	0/1	1.54s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.646 ردِعمل کا وقت (اوسط) 1.54s
#105	Gemini 3.1 Flash Lite low	Google	4.0	6.5	$0.621	0/1	1.37s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.621 ردِعمل کا وقت (اوسط) 1.37s
#106	Gemini 3.1 Flash Lite Preview none	Google	4.0	6.4	$0.052	0/1	741ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.052 ردِعمل کا وقت (اوسط) 741ms
#113	MiMo-V2-Flash medium	Xiaomi	4.0	6.3	$0.043	0/1	4.20s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.043 ردِعمل کا وقت (اوسط) 4.20s
#120	Gemini 3.1 Flash Lite minimal	Google	4.0	6.1	$0.047	0/1	791ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.047 ردِعمل کا وقت (اوسط) 791ms
#122	Gemini 3.1 Flash Lite none	Google	4.0	6.1	$0.046	0/1	992ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.046 ردِعمل کا وقت (اوسط) 992ms

عمومی ذہانت درجہ بندی

ماڈلز فلٹر کریں

عمومی ذہانت اسکور کے لحاظ سے سرفہرست ماڈلز

عمومی ذہانت اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز