معلومات عامہ ماڈل درجہ بندی

AI BENCHY زمرہ

دیکھیں کہ معلومات عامہ میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.

دکھائے گئے ماڈلز

اوسط معلومات عامہ اسکور

2.9

بہترین ماڈل

MiMo-V2-Omni 3.0

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ117

درجہ	ماڈل	کمپنی	معلومات عامہ اسکور	اسکور	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#70	Qwen3.6 27B medium	Qwen	3.0	6.8	0/1	81.0s
#106	MiniMax M2.5 medium	Minimax	3.0	5.5	0/1	80.8s
#19	GLM 5 medium	Z.ai	3.0	8.1	0/1	67.4s
#66	Grok 4.20 medium	X AI	3.0	6.9	0/1	63.5s
#52	Claude Opus 4.6 medium	Anthropic	3.0	7.4	0/1	63.2s
#9	Qwen3.6 Max Preview medium	Qwen	3.0	8.5	0/1	60.6s
#56	Seed-2.0-Mini medium	Bytedance Seed	3.0	7.2	0/1	56.8s
#85	Nemotron 3 Super medium	NVIDIA	3.0	6.1	0/1	55.3s
#48	DeepSeek V4 Flash high	DeepSeek	3.0	7.6	0/1	54.5s
#31	Qwen3.5-122B-A10B medium	Qwen	3.0	7.9	0/1	52.9s
#45	Qwen3.5-Flash medium	Qwen	3.0	7.6	0/1	49.0s
#11	Seed-2.0-Lite medium	Bytedance Seed	3.0	8.3	0/1	48.3s
#22	HY3 Preview high	Tencent	3.0	8.0	0/1	47.7s
#28	Qwen3.6 Plus medium	Qwen	3.0	7.9	0/1	47.5s
#119	gpt-oss-120b none	OpenAI	3.0	5.2	0/1	47.3s

←

1 2 3 9

→

معلومات عامہ درجہ بندی

معلومات عامہ اسکور کے لحاظ سے سرفہرست ماڈلز

معلومات عامہ اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز