ڈیٹا پارسنگ اور استخراج ماڈل درجہ بندی

دیکھیں کہ ڈیٹا پارسنگ اور استخراج میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: میٹرک ↑.

دکھائے گئے ماڈلز

اوسط ڈیٹا پارسنگ اور استخراج اسکور

8.9

بہترین ماڈل

Step 3.5 Flash 1.5

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ41 ناکامی کی وجہ API خرابی کے ساتھ14 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ8 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ6 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ1

210/210

درجہ	ماڈل	کمپنی	ڈیٹا پارسنگ اور استخراج اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#193	Elephant Alpha none	Openrouter	6.5	4.3	$0.000	1/2	1.04s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 1.04s
#195	Elephant Alpha medium	Openrouter	6.5	4.3	$0.000	1/2	979ms
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 979ms
#79	Gemini 3.5 Flash none	Google	6.5	7.0	$1.079	1/2	8.10s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $1.079 ردِعمل کا وقت (اوسط) 8.10s
#100	Hy3 preview medium	Tencent	6.5	6.5	$0.018	1/2	5.25s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.018 ردِعمل کا وقت (اوسط) 5.25s
#113	MiMo-V2-Flash medium	Xiaomi	6.5	6.3	$0.043	1/2	0ms
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.043 ردِعمل کا وقت (اوسط) 0ms
#135	Hy3 preview high	Tencent	6.5	5.9	$0.048	1/2	12.1s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.048 ردِعمل کا وقت (اوسط) 12.1s
#153	Hy3 preview low	Tencent	6.5	5.5	$0.015	1/2	5.85s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.015 ردِعمل کا وقت (اوسط) 5.85s
#168	MiMo-V2.5 none	Xiaomi	6.5	5.1	$0.025	1/2	1.01s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.025 ردِعمل کا وقت (اوسط) 1.01s
#199	Hy3 preview none	Tencent	6.5	4.0	$0.003	1/2	2.85s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.003 ردِعمل کا وقت (اوسط) 2.85s
#206	gpt-oss-120b none	OpenAI	6.5	3.7	$0.010	1/2	7.12s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.010 ردِعمل کا وقت (اوسط) 7.12s
#14	Claude Opus 4.8 medium	Anthropic	7.1	8.8	$1.931	1/2	12.3s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $1.931 ردِعمل کا وقت (اوسط) 12.3s
#42	GLM 5 medium	Z.ai	7.1	7.7	$0.307	1/2	8.90s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.307 ردِعمل کا وقت (اوسط) 8.90s
#198	Laguna Xs.2 medium	Poolside	7.1	4.1	$0.015	1/2	9.34s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.015 ردِعمل کا وقت (اوسط) 9.34s
#33	Kimi K3 max	Moonshot AI	7.3	8.0	$3.112	1/2	16.7s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $3.112 ردِعمل کا وقت (اوسط) 16.7s
#66	Claude Opus 4.8 none	Anthropic	7.3	7.3	$1.166	1/2	1.77s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $1.166 ردِعمل کا وقت (اوسط) 1.77s

ڈیٹا پارسنگ اور استخراج درجہ بندی

ماڈلز فلٹر کریں

ڈیٹا پارسنگ اور استخراج اسکور کے لحاظ سے سرفہرست ماڈلز

ڈیٹا پارسنگ اور استخراج اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز