عمومی ذہانت ماڈل درجہ بندی

دیکھیں کہ عمومی ذہانت میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔

دکھائے گئے ماڈلز

اوسط عمومی ذہانت اسکور

6.1

بہترین ماڈل

Gemini 3.6 Flash 10.0

ناکامی کی وجوہات

ناکامی کی وجہ ہدایات پر عمل نہیں کیا کے ساتھ78 ناکامی کی وجہ غلط جواب کے ساتھ62 ناکامی کی وجہ API خرابی کے ساتھ12 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ4

216/216

درجہ	ماڈل	کمپنی	عمومی ذہانت اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#190	Hunter Alpha medium	OpenRouter	7.0	4.7	$0.000	0/1	6.44s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 6.44s
#39	Seed-2.0-Lite medium	Bytedance Seed	6.7	7.9	$0.234	0/1	18.2s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.234 ردِعمل کا وقت (اوسط) 18.2s
#25	Grok 4.5 medium	X AI	6.5	8.3	$1.928	0/1	12.8s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $1.928 ردِعمل کا وقت (اوسط) 12.8s
#81	Kimi K2.5 medium	Moonshot AI	6.5	7.0	$0.600	0/1	69.7s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.600 ردِعمل کا وقت (اوسط) 69.7s
#87	GPT-5.6 Sol none	OpenAI	6.5	6.9	$0.524	0/1	1.52s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.524 ردِعمل کا وقت (اوسط) 1.52s
#105	Qwen3.6 27B medium	Qwen	6.5	6.5	$0.779	0/1	39.5s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.779 ردِعمل کا وقت (اوسط) 39.5s
#133	Qwen3.5-35B-A3B none	Qwen	6.5	6.1	$0.106	0/1	1.19s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.106 ردِعمل کا وقت (اوسط) 1.19s
#193	Qwen3 Coder Next medium	Qwen	6.3	4.7	$0.032	0/1	1.39s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.032 ردِعمل کا وقت (اوسط) 1.39s
#23	Grok 4.5 low	X AI	6.1	8.4	$0.935	0/1	4.88s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.935 ردِعمل کا وقت (اوسط) 4.88s
#46	GLM 5 medium	Z.ai	6.1	7.7	$0.307	0/1	14.7s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.307 ردِعمل کا وقت (اوسط) 14.7s
#49	DeepSeek V4 Flash high	DeepSeek	6.1	7.7	$0.041	0/1	25.2s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.041 ردِعمل کا وقت (اوسط) 25.2s
#53	GLM 5 Turbo medium	Z.ai	6.1	7.6	$0.323	0/1	10.1s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.323 ردِعمل کا وقت (اوسط) 10.1s
#62	Qwen3.5-27B medium	Qwen	6.1	7.4	$1.627	0/1	101.4s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $1.627 ردِعمل کا وقت (اوسط) 101.4s
#67	Claude Sonnet 4.6 none	Anthropic	6.1	7.3	$0.661	0/1	2.56s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.661 ردِعمل کا وقت (اوسط) 2.56s
#95	Gemini 3.5 Flash-Lite low	Google	6.1	6.7	$0.145	0/1	1.71s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.145 ردِعمل کا وقت (اوسط) 1.71s

عمومی ذہانت درجہ بندی

ماڈلز فلٹر کریں

عمومی ذہانت اسکور کے لحاظ سے سرفہرست ماڈلز

عمومی ذہانت اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز