عمومی ذہانت ماڈل درجہ بندی

دیکھیں کہ عمومی ذہانت میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: میٹرک ↑.

دکھائے گئے ماڈلز

اوسط عمومی ذہانت اسکور

6.1

بہترین ماڈل

Qwen3.5-35B-A3B 2.8

ناکامی کی وجوہات

ناکامی کی وجہ ہدایات پر عمل نہیں کیا کے ساتھ78 ناکامی کی وجہ غلط جواب کے ساتھ62 ناکامی کی وجہ API خرابی کے ساتھ12 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ4

216/216

درجہ	ماڈل	کمپنی	عمومی ذہانت اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#206	MiMo-V2-Flash none	Xiaomi	4.6	4.0	$0.025	0/1	1.67s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.025 ردِعمل کا وقت (اوسط) 1.67s
#15	Grok 4.5 high	X AI	4.7	8.9	$1.707	0/1	9.82s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $1.707 ردِعمل کا وقت (اوسط) 9.82s
#61	Qwen3.5 Plus 2026-02-15 medium	Qwen	4.7	7.5	$0.437	0/1	79.9s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.437 ردِعمل کا وقت (اوسط) 79.9s
#179	DeepSeek V3.2 none	DeepSeek	4.7	5.0	$0.054	0/1	9.32s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.054 ردِعمل کا وقت (اوسط) 9.32s
#21	GPT-5.4 medium	OpenAI	4.7	8.5	$1.533	0/1	4.92s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $1.533 ردِعمل کا وقت (اوسط) 4.92s
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	4.7	6.9	$0.467	0/1	2.35s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.467 ردِعمل کا وقت (اوسط) 2.35s
#118	Claude Sonnet 5 none	Anthropic	4.7	6.3	$0.548	0/1	2.81s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.548 ردِعمل کا وقت (اوسط) 2.81s
#28	Gemini 2.5 Flash medium	Google	4.8	8.2	$0.643	0/1	4.86s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.643 ردِعمل کا وقت (اوسط) 4.86s
#82	Mercury 2 medium	Inception	4.8	7.0	$0.093	0/1	821ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.093 ردِعمل کا وقت (اوسط) 821ms
#132	Qwen3.5 Plus 2026-04-20 none	Qwen	4.8	6.1	$0.122	0/1	1.41s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.122 ردِعمل کا وقت (اوسط) 1.41s
#142	GPT-5.4 Mini none	OpenAI	4.8	5.9	$0.095	0/1	1.82s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.095 ردِعمل کا وقت (اوسط) 1.82s
#173	Mistral Small 4 medium	Mistral	4.8	5.1	$0.096	0/1	2.05s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.096 ردِعمل کا وقت (اوسط) 2.05s
#195	Mercury 2 none	Inception	4.8	4.6	$0.030	0/1	628ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.030 ردِعمل کا وقت (اوسط) 628ms
#203	Grok 4.20 none	X AI	4.8	4.1	$0.057	0/1	659ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.057 ردِعمل کا وقت (اوسط) 659ms
#212	gpt-oss-120b none	OpenAI	4.8	3.7	$0.010	0/1	10.8s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.010 ردِعمل کا وقت (اوسط) 10.8s

عمومی ذہانت درجہ بندی

ماڈلز فلٹر کریں

عمومی ذہانت اسکور کے لحاظ سے سرفہرست ماڈلز

عمومی ذہانت اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز