ڈیٹا پارسنگ اور استخراج ماڈل درجہ بندی

دیکھیں کہ ڈیٹا پارسنگ اور استخراج میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↑.

دکھائے گئے ماڈلز

اوسط ڈیٹا پارسنگ اور استخراج اسکور

8.9

بہترین ماڈل

MiMo-V2-Flash 6.5

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ41 ناکامی کی وجہ API خرابی کے ساتھ14 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ8 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ6 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ1

216/216

درجہ	ماڈل	کمپنی	ڈیٹا پارسنگ اور استخراج اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#103	Qwen3.6 Max Preview none	Qwen	10.0	6.6	$0.231	2/2	2.87s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.231 ردِعمل کا وقت (اوسط) 2.87s
#110	Gemini 3.1 Flash Lite Preview low	Google	10.0	6.5	$0.646	2/2	3.00s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.646 ردِعمل کا وقت (اوسط) 3.00s
#118	Claude Sonnet 5 none	Anthropic	10.0	6.3	$0.548	2/2	3.01s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.548 ردِعمل کا وقت (اوسط) 3.01s
#140	Mimo V2 Omni medium	Xiaomi	10.0	5.9	$0.683	2/2	3.04s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.683 ردِعمل کا وقت (اوسط) 3.04s
#34	GPT-5.2 Chat none	OpenAI	10.0	8.0	$0.604	2/2	3.05s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.604 ردِعمل کا وقت (اوسط) 3.05s
#16	GPT-5.3-Codex medium	OpenAI	10.0	8.9	$0.920	2/2	3.07s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.920 ردِعمل کا وقت (اوسط) 3.07s
#24	GPT-5.2 medium	OpenAI	10.0	8.4	$0.951	2/2	3.15s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.951 ردِعمل کا وقت (اوسط) 3.15s
#26	Claude Sonnet 5 medium	Anthropic	10.0	8.3	$0.922	2/2	3.16s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.922 ردِعمل کا وقت (اوسط) 3.16s
#27	Muse Spark 1.1 low	Meta	10.0	8.3	$0.647	2/2	3.22s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.647 ردِعمل کا وقت (اوسط) 3.22s
#189	Trinity Large Preview none	Arcee AI	10.0	4.8	$0.008	2/2	3.26s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.008 ردِعمل کا وقت (اوسط) 3.26s
#9	GPT-5.5 low	OpenAI	10.0	9.3	$1.253	2/2	3.28s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $1.253 ردِعمل کا وقت (اوسط) 3.28s
#198	Laguna M.1 none	Poolside	10.0	4.4	$0.009	2/2	3.37s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.009 ردِعمل کا وقت (اوسط) 3.37s
#67	Claude Sonnet 4.6 none	Anthropic	10.0	7.3	$0.661	2/2	3.43s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.661 ردِعمل کا وقت (اوسط) 3.43s
#23	Grok 4.5 low	X AI	10.0	8.4	$0.935	2/2	3.44s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.935 ردِعمل کا وقت (اوسط) 3.44s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	6.5	5.6	$0.077	1/2	3.59s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.077 ردِعمل کا وقت (اوسط) 3.59s

ڈیٹا پارسنگ اور استخراج درجہ بندی

ماڈلز فلٹر کریں

ڈیٹا پارسنگ اور استخراج اسکور کے لحاظ سے سرفہرست ماڈلز

ڈیٹا پارسنگ اور استخراج اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز