ڈیٹا پارسنگ اور استخراج ماڈل درجہ بندی

دیکھیں کہ ڈیٹا پارسنگ اور استخراج میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: درست ٹیسٹس ↑.

دکھائے گئے ماڈلز

اوسط ڈیٹا پارسنگ اور استخراج اسکور

8.9

بہترین ماڈل

LongCat 2.0 3.6

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ41 ناکامی کی وجہ API خرابی کے ساتھ14 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ8 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ6 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ1

216/216

درجہ	ماڈل	کمپنی	ڈیٹا پارسنگ اور استخراج اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#34	GPT-5.2 Chat none	OpenAI	10.0	8.0	$0.604	2/2	3.05s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.604 ردِعمل کا وقت (اوسط) 3.05s
#35	GLM 5.2 high	Z.ai	10.0	8.0	$0.817	2/2	5.81s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.817 ردِعمل کا وقت (اوسط) 5.81s
#36	Inkling medium	Thinkingmachines	10.0	8.0	$0.391	2/2	3.60s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.391 ردِعمل کا وقت (اوسط) 3.60s
#38	GPT-5.6 Terra high	OpenAI	10.0	8.0	$1.055	2/2	938ms
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $1.055 ردِعمل کا وقت (اوسط) 938ms
#39	Seed-2.0-Lite medium	Bytedance Seed	10.0	7.9	$0.234	2/2	9.07s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.234 ردِعمل کا وقت (اوسط) 9.07s
#40	Qwen3.7 Plus medium	Qwen	10.0	7.9	$0.267	2/2	21.7s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.267 ردِعمل کا وقت (اوسط) 21.7s
#41	Qwen3.6 Plus medium	Qwen	10.0	7.8	$0.405	2/2	14.9s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.405 ردِعمل کا وقت (اوسط) 14.9s
#42	GLM 5.2 medium	Z.ai	10.0	7.8	$0.187	2/2	13.4s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.187 ردِعمل کا وقت (اوسط) 13.4s
#43	GPT-5.6 Terra medium	OpenAI	10.0	7.8	$0.676	2/2	872ms
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.676 ردِعمل کا وقت (اوسط) 872ms
#44	Claude Sonnet 4.6 medium	Anthropic	10.0	7.8	$2.057	2/2	13.9s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $2.057 ردِعمل کا وقت (اوسط) 13.9s
#47	Claude Opus 4.6 medium	Anthropic	10.0	7.7	$3.059	2/2	7.37s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $3.059 ردِعمل کا وقت (اوسط) 7.37s
#48	GPT-5.6 Luna high	OpenAI	10.0	7.7	$1.017	2/2	2.18s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $1.017 ردِعمل کا وقت (اوسط) 2.18s
#49	DeepSeek V4 Flash high	DeepSeek	10.0	7.7	$0.041	2/2	28.0s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.041 ردِعمل کا وقت (اوسط) 28.0s
#50	DeepSeek V4 Pro high	DeepSeek	10.0	7.7	$0.200	2/2	25.0s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.200 ردِعمل کا وقت (اوسط) 25.0s
#51	MiniMax M3 medium	Minimax	10.0	7.6	$0.286	2/2	14.9s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.286 ردِعمل کا وقت (اوسط) 14.9s

ڈیٹا پارسنگ اور استخراج درجہ بندی

ماڈلز فلٹر کریں

ڈیٹا پارسنگ اور استخراج اسکور کے لحاظ سے سرفہرست ماڈلز

ڈیٹا پارسنگ اور استخراج اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز