عمومی ذہانت ماڈل درجہ بندی

دیکھیں کہ عمومی ذہانت میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: درست ٹیسٹس ↓.

دکھائے گئے ماڈلز

اوسط عمومی ذہانت اسکور

6.1

بہترین ماڈل

Gemini 3.6 Flash 10.0

ناکامی کی وجوہات

ناکامی کی وجہ ہدایات پر عمل نہیں کیا کے ساتھ78 ناکامی کی وجہ غلط جواب کے ساتھ62 ناکامی کی وجہ API خرابی کے ساتھ12 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ4

216/216

درجہ	ماڈل	کمپنی	عمومی ذہانت اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#108	Laguna XS 2.1 medium	Poolside	5.0	6.5	$0.068	0/1	4.15s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.068 ردِعمل کا وقت (اوسط) 4.15s
#109	Qwen3.5-27B none	Qwen	5.0	6.5	$0.090	0/1	2.51s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.090 ردِعمل کا وقت (اوسط) 2.51s
#110	Gemini 3.1 Flash Lite Preview low	Google	4.0	6.5	$0.646	0/1	1.54s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.646 ردِعمل کا وقت (اوسط) 1.54s
#111	Gemini 3.1 Flash Lite low	Google	4.0	6.5	$0.621	0/1	1.37s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.621 ردِعمل کا وقت (اوسط) 1.37s
#112	Gemini 3.1 Flash Lite Preview none	Google	4.0	6.4	$0.052	0/1	741ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.052 ردِعمل کا وقت (اوسط) 741ms
#113	Qwen3.5 Plus 2026-02-15 none	Qwen	4.4	6.4	$0.073	0/1	2.26s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.073 ردِعمل کا وقت (اوسط) 2.26s
#114	Ring-2.6-1T medium	Inclusionai	4.1	6.3	$0.103	0/1	58.3s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.103 ردِعمل کا وقت (اوسط) 58.3s
#117	LongCat 2.0 none	Meituan	5.0	6.3	$0.044	0/1	2.76s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.044 ردِعمل کا وقت (اوسط) 2.76s
#118	Claude Sonnet 5 none	Anthropic	4.7	6.3	$0.548	0/1	2.81s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.548 ردِعمل کا وقت (اوسط) 2.81s
#119	MiMo-V2-Flash medium	Xiaomi	4.0	6.3	$0.043	0/1	4.20s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.043 ردِعمل کا وقت (اوسط) 4.20s
#120	Qwen3.5-Flash medium	Qwen	6.1	6.2	$0.139	0/1	40.1s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.139 ردِعمل کا وقت (اوسط) 40.1s
#123	GPT-5.6 Luna low	OpenAI	5.0	6.2	$0.249	0/1	2.25s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.249 ردِعمل کا وقت (اوسط) 2.25s
#124	Gemini 2.5 Flash none	Google	5.0	6.2	$0.017	0/1	615ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.017 ردِعمل کا وقت (اوسط) 615ms
#125	Qwen3.5-35B-A3B medium	Qwen	2.8	6.2	$0.837	0/1	30.3s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.837 ردِعمل کا وقت (اوسط) 30.3s
#126	Gemini 3.1 Flash Lite minimal	Google	4.0	6.1	$0.047	0/1	791ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.047 ردِعمل کا وقت (اوسط) 791ms

عمومی ذہانت درجہ بندی

ماڈلز فلٹر کریں

عمومی ذہانت اسکور کے لحاظ سے سرفہرست ماڈلز

عمومی ذہانت اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز