ڈیٹا پارسنگ اور استخراج ماڈل درجہ بندی

دیکھیں کہ ڈیٹا پارسنگ اور استخراج میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: درست ٹیسٹس ↑.

دکھائے گئے ماڈلز

اوسط ڈیٹا پارسنگ اور استخراج اسکور

8.9

بہترین ماڈل

LongCat 2.0 3.6

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ41 ناکامی کی وجہ API خرابی کے ساتھ14 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ8 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ6 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ1

216/216

درجہ	ماڈل	کمپنی	ڈیٹا پارسنگ اور استخراج اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#19	Muse Spark 1.1 medium	Meta	10.0	8.6	$1.357	2/2	4.96s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $1.357 ردِعمل کا وقت (اوسط) 4.96s
#20	Claude Fable 5 medium	Anthropic	10.0	8.6	$3.478	2/2	7.18s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $3.478 ردِعمل کا وقت (اوسط) 7.18s
#21	GPT-5.4 medium	OpenAI	10.0	8.5	$1.533	2/2	5.32s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $1.533 ردِعمل کا وقت (اوسط) 5.32s
#22	Qwen3.6 Max Preview medium	Qwen	10.0	8.4	$1.143	2/2	41.2s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $1.143 ردِعمل کا وقت (اوسط) 41.2s
#23	Grok 4.5 low	X AI	10.0	8.4	$0.935	2/2	3.44s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.935 ردِعمل کا وقت (اوسط) 3.44s
#24	GPT-5.2 medium	OpenAI	10.0	8.4	$0.951	2/2	3.15s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.951 ردِعمل کا وقت (اوسط) 3.15s
#25	Grok 4.5 medium	X AI	10.0	8.3	$1.928	2/2	6.29s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $1.928 ردِعمل کا وقت (اوسط) 6.29s
#26	Claude Sonnet 5 medium	Anthropic	10.0	8.3	$0.922	2/2	3.16s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.922 ردِعمل کا وقت (اوسط) 3.16s
#27	Muse Spark 1.1 low	Meta	10.0	8.3	$0.647	2/2	3.22s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.647 ردِعمل کا وقت (اوسط) 3.22s
#28	Gemini 2.5 Flash medium	Google	10.0	8.2	$0.643	2/2	4.06s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.643 ردِعمل کا وقت (اوسط) 4.06s
#29	GPT-5 Mini medium	OpenAI	10.0	8.1	$0.237	2/2	12.6s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.237 ردِعمل کا وقت (اوسط) 12.6s
#30	Muse Spark 1.1 high	Meta	10.0	8.1	$1.694	2/2	8.40s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $1.694 ردِعمل کا وقت (اوسط) 8.40s
#31	Gemini 3.5 Flash-Lite high	Google	10.0	8.1	$0.584	2/2	2.71s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.584 ردِعمل کا وقت (اوسط) 2.71s
#32	Inkling high	Thinkingmachines	10.0	8.0	$1.006	2/2	8.19s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $1.006 ردِعمل کا وقت (اوسط) 8.19s
#33	Step 3.7 Flash medium	Stepfun	10.0	8.0	$0.515	2/2	2.75s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.515 ردِعمل کا وقت (اوسط) 2.75s

ڈیٹا پارسنگ اور استخراج درجہ بندی

ماڈلز فلٹر کریں

ڈیٹا پارسنگ اور استخراج اسکور کے لحاظ سے سرفہرست ماڈلز

ڈیٹا پارسنگ اور استخراج اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز