عمومی ذہانت ماڈل درجہ بندی

دیکھیں کہ عمومی ذہانت میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↑.

دکھائے گئے ماڈلز

اوسط عمومی ذہانت اسکور

6.1

بہترین ماڈل

Hy3 preview 3.0

ناکامی کی وجوہات

ناکامی کی وجہ ہدایات پر عمل نہیں کیا کے ساتھ78 ناکامی کی وجہ غلط جواب کے ساتھ59 ناکامی کی وجہ API خرابی کے ساتھ12 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ4

210/210

درجہ	ماڈل	کمپنی	عمومی ذہانت اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#189	Mercury 2 none	Inception	4.8	4.6	$0.030	0/1	628ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.030 ردِعمل کا وقت (اوسط) 628ms
#197	Grok 4.20 none	X AI	4.8	4.1	$0.057	0/1	659ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.057 ردِعمل کا وقت (اوسط) 659ms
#165	Mistral Small 4 none	Mistral	4.0	5.1	$0.022	0/1	729ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.022 ردِعمل کا وقت (اوسط) 729ms
#106	Gemini 3.1 Flash Lite Preview none	Google	4.0	6.4	$0.052	0/1	741ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.052 ردِعمل کا وقت (اوسط) 741ms
#151	GLM 5.1 none	Z.ai	5.0	5.5	$0.164	0/1	790ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.164 ردِعمل کا وقت (اوسط) 790ms
#120	Gemini 3.1 Flash Lite minimal	Google	4.0	6.1	$0.047	0/1	791ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.047 ردِعمل کا وقت (اوسط) 791ms
#125	Qwen3.5-Flash none	Qwen	10.0	6.1	$0.073	1/1	803ms
کل ٹیسٹس 1 غلط ٹیسٹس 0 کل لاگت $0.073 ردِعمل کا وقت (اوسط) 803ms
#78	Mercury 2 medium	Inception	4.8	7.0	$0.093	0/1	821ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.093 ردِعمل کا وقت (اوسط) 821ms
#193	Elephant Alpha none	Openrouter	4.0	4.3	$0.000	0/1	854ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 854ms
#164	Inkling none	Thinkingmachines	5.0	5.2	$0.147	0/1	859ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.147 ردِعمل کا وقت (اوسط) 859ms
#183	Trinity Large Preview none	Arcee AI	4.5	4.8	$0.008	0/1	873ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.008 ردِعمل کا وقت (اوسط) 873ms
#174	GPT-4o-mini none	OpenAI	4.0	5.0	$0.010	0/1	909ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.010 ردِعمل کا وقت (اوسط) 909ms
#195	Elephant Alpha medium	Openrouter	4.3	4.3	$0.000	0/1	920ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 920ms
#88	Gemini 3.5 Flash minimal	Google	10.0	6.8	$0.300	1/1	922ms
کل ٹیسٹس 1 غلط ٹیسٹس 0 کل لاگت $0.300 ردِعمل کا وقت (اوسط) 922ms
#124	Qwen3.6 Flash none	Qwen	10.0	6.1	$0.062	1/1	947ms
کل ٹیسٹس 1 غلط ٹیسٹس 0 کل لاگت $0.062 ردِعمل کا وقت (اوسط) 947ms

عمومی ذہانت درجہ بندی

ماڈلز فلٹر کریں

عمومی ذہانت اسکور کے لحاظ سے سرفہرست ماڈلز

عمومی ذہانت اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز