عمومی ذہانت ماڈل درجہ بندی

دیکھیں کہ عمومی ذہانت میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: درست ٹیسٹس ↑.

دکھائے گئے ماڈلز

اوسط عمومی ذہانت اسکور

6.1

بہترین ماڈل

Grok 4.5 4.7

ناکامی کی وجوہات

ناکامی کی وجہ ہدایات پر عمل نہیں کیا کے ساتھ78 ناکامی کی وجہ غلط جواب کے ساتھ59 ناکامی کی وجہ API خرابی کے ساتھ12 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ4

210/210

درجہ	ماڈل	کمپنی	عمومی ذہانت اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#42	GLM 5 medium	Z.ai	6.1	7.7	$0.307	0/1	14.7s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.307 ردِعمل کا وقت (اوسط) 14.7s
#44	GPT-5.6 Luna high	OpenAI	5.0	7.7	$1.017	0/1	3.65s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $1.017 ردِعمل کا وقت (اوسط) 3.65s
#45	DeepSeek V4 Flash high	DeepSeek	6.1	7.7	$0.042	0/1	25.2s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.042 ردِعمل کا وقت (اوسط) 25.2s
#47	MiniMax M3 medium	Minimax	5.1	7.6	$0.286	0/1	33.3s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.286 ردِعمل کا وقت (اوسط) 33.3s
#48	Grok Build 0.1 medium	X AI	4.4	7.6	$1.097	0/1	18.4s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $1.097 ردِعمل کا وقت (اوسط) 18.4s
#49	GLM 5 Turbo medium	Z.ai	6.1	7.6	$0.323	0/1	10.1s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.323 ردِعمل کا وقت (اوسط) 10.1s
#50	GPT-5.6 Luna medium	OpenAI	5.1	7.6	$0.352	0/1	4.34s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.352 ردِعمل کا وقت (اوسط) 4.34s
#51	Nemotron 3 Ultra medium	NVIDIA	3.7	7.5	$0.774	0/1	2.52s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.774 ردِعمل کا وقت (اوسط) 2.52s
#53	GPT-5.4 Nano medium	OpenAI	4.5	7.5	$0.138	0/1	4.15s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.138 ردِعمل کا وقت (اوسط) 4.15s
#54	GPT-5.3 Chat none	OpenAI	4.6	7.5	$0.571	0/1	1.99s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.571 ردِعمل کا وقت (اوسط) 1.99s
#55	GPT-5.6 Terra low	OpenAI	4.8	7.5	$0.519	0/1	3.52s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.519 ردِعمل کا وقت (اوسط) 3.52s
#56	GPT-5.4 Mini medium	OpenAI	4.5	7.5	$0.756	0/1	3.72s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.756 ردِعمل کا وقت (اوسط) 3.72s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	4.7	7.5	$0.437	0/1	79.9s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.437 ردِعمل کا وقت (اوسط) 79.9s
#58	Qwen3.5-27B medium	Qwen	6.1	7.4	$1.627	0/1	101.4s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $1.627 ردِعمل کا وقت (اوسط) 101.4s
#60	LongCat 2.0 medium	Meituan	4.8	7.4	$0.478	0/1	16.4s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.478 ردِعمل کا وقت (اوسط) 16.4s

عمومی ذہانت درجہ بندی

ماڈلز فلٹر کریں

عمومی ذہانت اسکور کے لحاظ سے سرفہرست ماڈلز

عمومی ذہانت اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز