معلومات عامہ ماڈل درجہ بندی

AI BENCHY زمرہ

دیکھیں کہ معلومات عامہ میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↑.

دکھائے گئے ماڈلز

اوسط معلومات عامہ اسکور

3.1

بہترین ماڈل

Grok 4.20 Beta 0.0

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ133 ناکامی کی وجہ API خرابی کے ساتھ13 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ8

169/169

درجہ	ماڈل	کمپنی	معلومات عامہ اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#102	Qwen3.6 Flash none	Qwen	3.0	6.0	$0.015	0/1	649ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.015 ردِعمل کا وقت (اوسط) 649ms
#141	GLM 4.7 Flash none	Z.ai	3.0	4.9	$0.004	0/1	692ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.004 ردِعمل کا وقت (اوسط) 692ms
#94	Gemini 3.1 Flash Lite minimal	Google	3.0	6.1	$0.013	0/1	724ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.013 ردِعمل کا وقت (اوسط) 724ms
#161	Grok 4.1 Fast none	X AI	3.0	4.0	$0.008	0/1	731ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.008 ردِعمل کا وقت (اوسط) 731ms
#96	Gemini 3.1 Flash Lite none	Google	3.0	6.1	$0.013	0/1	733ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.013 ردِعمل کا وقت (اوسط) 733ms
#145	GPT-5.4 Nano none	OpenAI	3.0	4.8	$0.011	0/1	773ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.011 ردِعمل کا وقت (اوسط) 773ms
#137	Trinity Large Preview none	Arcee AI	3.0	5.0	$0.008	0/1	777ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.008 ردِعمل کا وقت (اوسط) 777ms
#121	Gemma 4 26B A4B none	Google	3.0	5.5	$0.004	0/1	778ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.004 ردِعمل کا وقت (اوسط) 778ms
#139	GPT-4o-mini none	OpenAI	3.0	5.0	$0.006	0/1	794ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.006 ردِعمل کا وقت (اوسط) 794ms
#84	Gemini 3.1 Flash Lite Preview none	Google	3.0	6.4	$0.018	0/1	814ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.018 ردِعمل کا وقت (اوسط) 814ms
#68	Qwen3.7 Max none	Qwen	3.0	6.9	$0.054	0/1	856ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.054 ردِعمل کا وقت (اوسط) 856ms
#112	GPT-5.4 none	OpenAI	3.0	5.8	$0.122	0/1	990ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.122 ردِعمل کا وقت (اوسط) 990ms
#143	Ling-2.6-flash none	Inclusionai	3.0	4.9	$0.001	0/1	1.06s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.001 ردِعمل کا وقت (اوسط) 1.06s
#67	Gemini 3 Flash Preview none	Google	3.0	6.9	$0.025	0/1	1.07s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.025 ردِعمل کا وقت (اوسط) 1.07s
#106	Qwen3.5 Plus 2026-02-15 none	Qwen	3.0	5.8	$0.016	0/1	1.11s
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.016 ردِعمل کا وقت (اوسط) 1.11s

معلومات عامہ درجہ بندی

ماڈلز فلٹر کریں

معلومات عامہ اسکور کے لحاظ سے سرفہرست ماڈلز

معلومات عامہ اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز