ڈیٹا پارسنگ اور استخراج ماڈل درجہ بندی

دیکھیں کہ ڈیٹا پارسنگ اور استخراج میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.

دکھائے گئے ماڈلز

اوسط ڈیٹا پارسنگ اور استخراج اسکور

8.9

بہترین ماڈل

Qwen3.5-9B 3.6

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ41 ناکامی کی وجہ API خرابی کے ساتھ14 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ8 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ6 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ1

216/216

درجہ	ماڈل	کمپنی	ڈیٹا پارسنگ اور استخراج اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#2	Gemini 3.6 Flash high	Google	10.0	9.7	$1.785	2/2	5.20s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $1.785 ردِعمل کا وقت (اوسط) 5.20s
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	10.0	6.7	$0.476	2/2	5.07s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.476 ردِعمل کا وقت (اوسط) 5.07s
#19	Muse Spark 1.1 medium	Meta	10.0	8.6	$1.357	2/2	4.96s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $1.357 ردِعمل کا وقت (اوسط) 4.96s
#192	Laguna M.1 medium	Poolside	10.0	4.7	$0.033	2/2	4.93s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.033 ردِعمل کا وقت (اوسط) 4.93s
#182	GLM 4.7 Flash none	Z.ai	7.3	4.9	$0.016	1/2	4.82s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.016 ردِعمل کا وقت (اوسط) 4.82s
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	7.3	6.9	$0.467	1/2	4.70s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.467 ردِعمل کا وقت (اوسط) 4.70s
#86	DeepSeek V4 Pro none	DeepSeek	10.0	6.9	$0.096	2/2	4.61s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.096 ردِعمل کا وقت (اوسط) 4.61s
#108	Laguna XS 2.1 medium	Poolside	10.0	6.5	$0.068	2/2	4.50s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.068 ردِعمل کا وقت (اوسط) 4.50s
#149	Gemini 3.1 Flash Lite high	Google	10.0	5.6	$2.044	2/2	4.49s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $2.044 ردِعمل کا وقت (اوسط) 4.49s
#1	Gemini 3.6 Flash medium	Google	10.0	9.9	$0.831	2/2	4.26s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.831 ردِعمل کا وقت (اوسط) 4.26s
#66	KAT-Coder-Pro V2.5 low	Kwaipilot	10.0	7.4	$0.387	2/2	4.19s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.387 ردِعمل کا وقت (اوسط) 4.19s
#13	GPT-5.5 medium	OpenAI	10.0	9.0	$4.137	2/2	4.18s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $4.137 ردِعمل کا وقت (اوسط) 4.18s
#79	Grok 4.20 medium	X AI	10.0	7.1	$0.777	2/2	4.17s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.777 ردِعمل کا وقت (اوسط) 4.17s
#73	KAT-Coder-Pro V2.5 high	Kwaipilot	10.0	7.2	$0.482	2/2	4.13s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.482 ردِعمل کا وقت (اوسط) 4.13s
#12	Gemini 3.5 Flash medium	Google	10.0	9.1	$0.642	2/2	4.07s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.642 ردِعمل کا وقت (اوسط) 4.07s

ڈیٹا پارسنگ اور استخراج درجہ بندی

ماڈلز فلٹر کریں

ڈیٹا پارسنگ اور استخراج اسکور کے لحاظ سے سرفہرست ماڈلز

ڈیٹا پارسنگ اور استخراج اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز