عمومی ذہانت ماڈل درجہ بندی

دیکھیں کہ عمومی ذہانت میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↑.

دکھائے گئے ماڈلز

اوسط عمومی ذہانت اسکور

6.1

بہترین ماڈل

Hy3 preview 3.0

ناکامی کی وجوہات

ناکامی کی وجہ ہدایات پر عمل نہیں کیا کے ساتھ78 ناکامی کی وجہ غلط جواب کے ساتھ62 ناکامی کی وجہ API خرابی کے ساتھ12 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ4

216/216

درجہ	ماڈل	کمپنی	عمومی ذہانت اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#107	MiMo-V2.5 medium	Xiaomi	5.4	6.5	$0.082	0/1	5.37s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.082 ردِعمل کا وقت (اوسط) 5.37s
#137	Grok 4.20 Beta medium	X AI	10.0	6.0	$0.750	1/1	5.78s
کل ٹیسٹس 1 غلط ٹیسٹس 0 کل لاگت $0.750 ردِعمل کا وقت (اوسط) 5.78s
#187	Grok 4.20 Multi Agent Beta medium	X AI	5.8	4.8	$5.599	0/1	6.40s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $5.599 ردِعمل کا وقت (اوسط) 6.40s
#190	Hunter Alpha medium	OpenRouter	7.0	4.7	$0.000	0/1	6.44s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 6.44s
#32	Inkling high	Thinkingmachines	10.0	8.0	$1.006	1/1	6.53s
کل ٹیسٹس 1 غلط ٹیسٹس 0 کل لاگت $1.006 ردِعمل کا وقت (اوسط) 6.53s
#196	MiniMax M2.5 medium	Minimax	3.8	4.6	$0.340	0/1	6.63s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.340 ردِعمل کا وقت (اوسط) 6.63s
#33	Step 3.7 Flash medium	Stepfun	4.0	8.0	$0.515	0/1	6.85s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.515 ردِعمل کا وقت (اوسط) 6.85s
#174	MiMo-V2.5 none	Xiaomi	4.4	5.1	$0.025	0/1	6.86s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.025 ردِعمل کا وقت (اوسط) 6.86s
#146	Nemotron 3 Super medium	NVIDIA	4.1	5.7	$0.055	0/1	6.91s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.055 ردِعمل کا وقت (اوسط) 6.91s
#71	Step 3.7 Flash low	Stepfun	3.4	7.3	$0.454	0/1	7.00s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.454 ردِعمل کا وقت (اوسط) 7.00s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	5.1	5.6	$0.077	0/1	7.10s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.077 ردِعمل کا وقت (اوسط) 7.10s
#20	Claude Fable 5 medium	Anthropic	10.0	8.6	$3.478	1/1	7.42s
کل ٹیسٹس 1 غلط ٹیسٹس 0 کل لاگت $3.478 ردِعمل کا وقت (اوسط) 7.42s
#30	Muse Spark 1.1 high	Meta	10.0	8.1	$1.694	1/1	7.73s
کل ٹیسٹس 1 غلط ٹیسٹس 0 کل لاگت $1.694 ردِعمل کا وقت (اوسط) 7.73s
#127	gpt-oss-120b medium	OpenAI	4.3	6.1	$0.019	0/1	7.90s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.019 ردِعمل کا وقت (اوسط) 7.90s
#94	Qwen3.6 35B A3B medium	Qwen	4.4	6.7	$0.746	0/1	8.66s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.746 ردِعمل کا وقت (اوسط) 8.66s

←

1 9 10 11 15

→

عمومی ذہانت درجہ بندی

ماڈلز فلٹر کریں

عمومی ذہانت اسکور کے لحاظ سے سرفہرست ماڈلز

عمومی ذہانت اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز