ڈیٹا پارسنگ اور استخراج ماڈل درجہ بندی

دیکھیں کہ ڈیٹا پارسنگ اور استخراج میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: درست ٹیسٹس ↑.

دکھائے گئے ماڈلز

اوسط ڈیٹا پارسنگ اور استخراج اسکور

8.9

بہترین ماڈل

LongCat 2.0 3.6

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ41 ناکامی کی وجہ API خرابی کے ساتھ14 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ8 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ6 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ1

210/210

درجہ	ماڈل	کمپنی	ڈیٹا پارسنگ اور استخراج اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#41	Claude Opus 4.8 low	Anthropic	6.3	7.8	$2.077	1/2	2.27s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $2.077 ردِعمل کا وقت (اوسط) 2.27s
#42	GLM 5 medium	Z.ai	7.1	7.7	$0.307	1/2	8.90s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.307 ردِعمل کا وقت (اوسط) 8.90s
#60	LongCat 2.0 medium	Meituan	6.3	7.4	$0.478	1/2	10.6s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.478 ردِعمل کا وقت (اوسط) 10.6s
#66	Claude Opus 4.8 none	Anthropic	7.3	7.3	$1.166	1/2	1.77s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $1.166 ردِعمل کا وقت (اوسط) 1.77s
#67	Step 3.7 Flash low	Stepfun	7.3	7.3	$0.454	1/2	2.29s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.454 ردِعمل کا وقت (اوسط) 2.29s
#78	Mercury 2 medium	Inception	7.3	7.0	$0.093	1/2	1.11s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.093 ردِعمل کا وقت (اوسط) 1.11s
#79	Gemini 3.5 Flash none	Google	6.5	7.0	$1.079	1/2	8.10s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $1.079 ردِعمل کا وقت (اوسط) 8.10s
#81	KAT-Coder-Pro V2.5 medium	Kwaipilot	7.3	6.9	$0.467	1/2	4.70s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.467 ردِعمل کا وقت (اوسط) 4.70s
#84	MiMo-V2.5-Pro medium	Xiaomi	7.3	6.9	$0.187	1/2	18.8s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.187 ردِعمل کا وقت (اوسط) 18.8s
#91	LongCat 2.0 low	Meituan	6.3	6.7	$0.391	1/2	10.8s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.391 ردِعمل کا وقت (اوسط) 10.8s
#100	Hy3 preview medium	Tencent	6.5	6.5	$0.018	1/2	5.25s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.018 ردِعمل کا وقت (اوسط) 5.25s
#108	Ring-2.6-1T medium	Inclusionai	6.5	6.3	$0.103	1/2	37.4s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.103 ردِعمل کا وقت (اوسط) 37.4s
#109	Mimo V2 PRO medium	Xiaomi	7.3	6.3	$0.333	1/2	17.2s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.333 ردِعمل کا وقت (اوسط) 17.2s
#113	MiMo-V2-Flash medium	Xiaomi	6.5	6.3	$0.043	1/2	0ms
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.043 ردِعمل کا وقت (اوسط) 0ms
#114	Qwen3.5-Flash medium	Qwen	7.3	6.2	$0.139	1/2	57.0s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.139 ردِعمل کا وقت (اوسط) 57.0s

ڈیٹا پارسنگ اور استخراج درجہ بندی

ماڈلز فلٹر کریں

ڈیٹا پارسنگ اور استخراج اسکور کے لحاظ سے سرفہرست ماڈلز

ڈیٹا پارسنگ اور استخراج اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز