ڈیٹا پارسنگ اور استخراج ماڈل درجہ بندی

دیکھیں کہ ڈیٹا پارسنگ اور استخراج میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: میٹرک ↑.

دکھائے گئے ماڈلز

اوسط ڈیٹا پارسنگ اور استخراج اسکور

8.9

بہترین ماڈل

Step 3.5 Flash 1.5

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ41 ناکامی کی وجہ API خرابی کے ساتھ14 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ8 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ6 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ1

220/220

درجہ	ماڈل	کمپنی	ڈیٹا پارسنگ اور استخراج اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#71	Step 3.7 Flash low	Stepfun	7.3	7.3	$0.454	1/2	2.29s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.454 ردِعمل کا وقت (اوسط) 2.29s
#88	MiMo-V2.5-Pro medium	Xiaomi	7.3	6.9	$0.187	1/2	18.8s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.187 ردِعمل کا وقت (اوسط) 18.8s
#115	Mimo V2 PRO medium	Xiaomi	7.3	6.3	$0.333	1/2	17.2s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.333 ردِعمل کا وقت (اوسط) 17.2s
#158	Qwen3.6 27B none	Qwen	7.3	5.5	$0.087	1/2	2.06s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.087 ردِعمل کا وقت (اوسط) 2.06s
#161	Kimi K2.5 none	Moonshot AI	7.3	5.5	$0.127	1/2	42.1s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.127 ردِعمل کا وقت (اوسط) 42.1s
#185	GLM 4.7 Flash none	Z.ai	7.3	4.9	$0.016	1/2	4.82s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.016 ردِعمل کا وقت (اوسط) 4.82s
#82	Mercury 2 medium	Inception	7.3	7.0	$0.093	1/2	1.11s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.093 ردِعمل کا وقت (اوسط) 1.11s
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	7.3	6.9	$0.467	1/2	4.70s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.467 ردِعمل کا وقت (اوسط) 4.70s
#120	Qwen3.5-Flash medium	Qwen	7.3	6.2	$0.139	1/2	57.0s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.139 ردِعمل کا وقت (اوسط) 57.0s
#125	Qwen3.5-35B-A3B medium	Qwen	7.3	6.2	$0.837	1/2	59.3s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.837 ردِعمل کا وقت (اوسط) 59.3s
#175	Mistral Small 4 medium	Mistral	7.3	5.1	$0.096	1/2	1.23s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.096 ردِعمل کا وقت (اوسط) 1.23s
#198	Mercury 2 none	Inception	7.3	4.6	$0.030	1/2	667ms
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.030 ردِعمل کا وقت (اوسط) 667ms
#217	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	7.3	3.4	$0.000	1/2	2.72s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 2.72s
#1	Gemini 3.6 Flash medium	Google	10.0	9.9	$0.831	2/2	4.26s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.831 ردِعمل کا وقت (اوسط) 4.26s
#2	Gemini 3.6 Flash high	Google	10.0	9.7	$1.785	2/2	5.20s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $1.785 ردِعمل کا وقت (اوسط) 5.20s

ڈیٹا پارسنگ اور استخراج درجہ بندی

ماڈلز فلٹر کریں

ڈیٹا پارسنگ اور استخراج اسکور کے لحاظ سے سرفہرست ماڈلز

ڈیٹا پارسنگ اور استخراج اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز