معلومات عامہ ماڈل درجہ بندی

AI BENCHY زمرہ

دیکھیں کہ معلومات عامہ میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: کل لاگت ↓.

دکھائے گئے ماڈلز

اوسط معلومات عامہ اسکور

3.1

بہترین ماڈل

Grok 4.20 Multi Agent Beta 0.0

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ133 ناکامی کی وجہ API خرابی کے ساتھ13 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ8

169/169

درجہ	ماڈل	کمپنی	معلومات عامہ اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#158	Hy3 preview none	Tencent	3.0	4.3	$0.003	0/1	2.71s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.003 ردِعمل کا وقت (اوسط) 2.71s
#143	Ling-2.6-flash none	Inclusionai	3.0	4.9	$0.001	0/1	1.06s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.001 ردِعمل کا وقت (اوسط) 1.06s
#169	LFM2-24B-A2B none	Liquid	0.0	2.4	$0.001	0/0	0ms
کل ٹیسٹس 0 غلط ٹیسٹس 0 کل لاگت $0.001 ردِعمل کا وقت (اوسط) 0ms
#107	North Mini Code medium	Cohere	3.0	5.8	$0.000	0/1	305.0s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 305.0s
#108	Owl Alpha medium	Openrouter	3.0	5.8	$0.000	0/1	2.38s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 2.38s
#110	Owl Alpha none	Openrouter	3.0	5.8	$0.000	0/1	2.50s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 2.50s
#113	Qwen3.6 Plus Preview medium	Qwen	3.0	5.8	$0.000	0/1	0ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 0ms
#131	North Mini Code none	Cohere	3.0	5.1	$0.000	0/1	37.4s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 37.4s
#132	Hunter Alpha medium	OpenRouter	0.0	5.1	$0.000	0/0	0ms
کل ٹیسٹس 0 غلط ٹیسٹس 0 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 0ms
#138	Laguna M.1 medium	Poolside	3.0	5.0	$0.000	0/1	0ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 0ms
#140	Cobuddy medium	Baidu	3.0	4.9	$0.000	0/1	37.0s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 37.0s
#150	Laguna M.1 none	Poolside	3.0	4.6	$0.000	0/1	0ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 0ms
#152	Elephant Alpha none	Openrouter	3.0	4.6	$0.000	0/1	0ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 0ms
#153	Elephant Alpha medium	Openrouter	3.0	4.5	$0.000	0/1	0ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 0ms
#154	Hunter Alpha none	OpenRouter	0.0	4.5	$0.000	0/0	0ms
کل ٹیسٹس 0 غلط ٹیسٹس 0 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 0ms

معلومات عامہ درجہ بندی

ماڈلز فلٹر کریں

معلومات عامہ اسکور کے لحاظ سے سرفہرست ماڈلز

معلومات عامہ اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز