ڈیٹا پارسنگ اور استخراج ماڈل درجہ بندی

دیکھیں کہ ڈیٹا پارسنگ اور استخراج میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: درست ٹیسٹس ↑.

دکھائے گئے ماڈلز

اوسط ڈیٹا پارسنگ اور استخراج اسکور

8.9

بہترین ماڈل

LongCat 2.0 3.6

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ41 ناکامی کی وجہ API خرابی کے ساتھ14 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ8 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ6 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ1

210/210

درجہ	ماڈل	کمپنی	ڈیٹا پارسنگ اور استخراج اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#97	LongCat 2.0 high	Meituan	3.6	6.6	$0.469	0/2	11.0s
کل ٹیسٹس 2 غلط ٹیسٹس 2 کل لاگت $0.469 ردِعمل کا وقت (اوسط) 11.0s
#99	Qwen3.6 27B medium	Qwen	3.5	6.5	$0.779	0/2	37.3s
کل ٹیسٹس 2 غلط ٹیسٹس 2 کل لاگت $0.779 ردِعمل کا وقت (اوسط) 37.3s
#101	MiMo-V2.5 medium	Xiaomi	2.7	6.5	$0.082	0/2	6.33s
کل ٹیسٹس 2 غلط ٹیسٹس 2 کل لاگت $0.082 ردِعمل کا وقت (اوسط) 6.33s
#128	GPT-5 Nano medium	OpenAI	3.7	6.1	$0.114	0/2	21.4s
کل ٹیسٹس 2 غلط ٹیسٹس 2 کل لاگت $0.114 ردِعمل کا وقت (اوسط) 21.4s
#179	Ring-2.6-1T none	Inclusionai	3.0	4.8	$0.026	0/2	45.9s
کل ٹیسٹس 2 غلط ٹیسٹس 2 کل لاگت $0.026 ردِعمل کا وقت (اوسط) 45.9s
#190	MiniMax M2.5 medium	Minimax	4.6	4.6	$0.340	0/2	7.48s
کل ٹیسٹس 2 غلط ٹیسٹس 2 کل لاگت $0.340 ردِعمل کا وقت (اوسط) 7.48s
#200	MiMo-V2-Flash none	Xiaomi	2.9	4.0	$0.025	0/2	19.7s
کل ٹیسٹس 2 غلط ٹیسٹس 2 کل لاگت $0.025 ردِعمل کا وقت (اوسط) 19.7s
#201	Granite 4.1 8B none	IBM Granite	3.0	4.0	$0.007	0/2	575ms
کل ٹیسٹس 2 غلط ٹیسٹس 2 کل لاگت $0.007 ردِعمل کا وقت (اوسط) 575ms
#202	Grok Build 0.1 none	X AI	3.8	4.0	$0.547	0/2	9.33s
کل ٹیسٹس 2 غلط ٹیسٹس 2 کل لاگت $0.547 ردِعمل کا وقت (اوسط) 9.33s
#204	Qwen3.5-9B medium	Qwen	3.6	3.8	$0.036	0/2	87.3s
کل ٹیسٹس 2 غلط ٹیسٹس 2 کل لاگت $0.036 ردِعمل کا وقت (اوسط) 87.3s
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.8	3.2	$0.000	0/2	1.42s
کل ٹیسٹس 2 غلط ٹیسٹس 2 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 1.42s
#209	Step 3.5 Flash none	Stepfun	1.5	2.3	$0.020	0/1	0ms
کل ٹیسٹس 1 غلط ٹیسٹس 1 کل لاگت $0.020 ردِعمل کا وقت (اوسط) 0ms
#210	LFM2-24B-A2B none	Liquid	3.0	2.2	$0.001	0/2	714ms
کل ٹیسٹس 2 غلط ٹیسٹس 2 کل لاگت $0.001 ردِعمل کا وقت (اوسط) 714ms
#14	Claude Opus 4.8 medium	Anthropic	7.1	8.8	$1.931	1/2	12.3s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $1.931 ردِعمل کا وقت (اوسط) 12.3s
#33	Kimi K3 max	Moonshot AI	7.3	8.0	$3.112	1/2	16.7s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $3.112 ردِعمل کا وقت (اوسط) 16.7s

1 2 14

→

ڈیٹا پارسنگ اور استخراج درجہ بندی

ماڈلز فلٹر کریں

ڈیٹا پارسنگ اور استخراج اسکور کے لحاظ سے سرفہرست ماڈلز

ڈیٹا پارسنگ اور استخراج اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز