ڈیٹا پارسنگ اور استخراج ماڈل درجہ بندی

دیکھیں کہ ڈیٹا پارسنگ اور استخراج میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↑.

دکھائے گئے ماڈلز

اوسط ڈیٹا پارسنگ اور استخراج اسکور

8.9

بہترین ماڈل

MiMo-V2-Flash 6.5

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ41 ناکامی کی وجہ API خرابی کے ساتھ14 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ8 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ6 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ1

216/216

درجہ	ماڈل	کمپنی	ڈیٹا پارسنگ اور استخراج اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#71	Step 3.7 Flash low	Stepfun	7.3	7.3	$0.454	1/2	2.29s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.454 ردِعمل کا وقت (اوسط) 2.29s
#68	Gemini 3.1 Flash Lite Preview medium	Google	10.0	7.3	$0.115	2/2	2.29s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.115 ردِعمل کا وقت (اوسط) 2.29s
#117	LongCat 2.0 none	Meituan	10.0	6.3	$0.044	2/2	2.36s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.044 ردِعمل کا وقت (اوسط) 2.36s
#18	Claude Opus 4.7 medium	Anthropic	10.0	8.7	$1.477	2/2	2.37s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $1.477 ردِعمل کا وقت (اوسط) 2.37s
#60	GPT-5.4 Mini medium	OpenAI	10.0	7.5	$0.756	2/2	2.43s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.756 ردِعمل کا وقت (اوسط) 2.43s
#176	GLM 5 Turbo none	Z.ai	10.0	5.1	$0.047	2/2	2.47s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.047 ردِعمل کا وقت (اوسط) 2.47s
#57	GPT-5.4 Nano medium	OpenAI	10.0	7.5	$0.138	2/2	2.54s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.138 ردِعمل کا وقت (اوسط) 2.54s
#69	Gemini 3.1 Flash Lite medium	Google	10.0	7.3	$0.117	2/2	2.60s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.117 ردِعمل کا وقت (اوسط) 2.60s
#188	KAT-Coder-Air V2.5 none	Kwaipilot	6.3	4.8	$0.067	1/2	2.66s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.067 ردِعمل کا وقت (اوسط) 2.66s
#31	Gemini 3.5 Flash-Lite high	Google	10.0	8.1	$0.584	2/2	2.71s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.584 ردِعمل کا وقت (اوسط) 2.71s
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	7.3	3.4	$0.000	1/2	2.72s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 2.72s
#33	Step 3.7 Flash medium	Stepfun	10.0	8.0	$0.515	2/2	2.75s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.515 ردِعمل کا وقت (اوسط) 2.75s
#164	KAT-Coder-Air V2.5 low	Kwaipilot	6.5	5.4	$0.041	1/2	2.82s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.041 ردِعمل کا وقت (اوسط) 2.82s
#132	Qwen3.5 Plus 2026-04-20 none	Qwen	10.0	6.1	$0.122	2/2	2.82s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.122 ردِعمل کا وقت (اوسط) 2.82s
#205	Hy3 preview none	Tencent	6.5	4.0	$0.003	1/2	2.85s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.003 ردِعمل کا وقت (اوسط) 2.85s

ڈیٹا پارسنگ اور استخراج درجہ بندی

ماڈلز فلٹر کریں

ڈیٹا پارسنگ اور استخراج اسکور کے لحاظ سے سرفہرست ماڈلز

ڈیٹا پارسنگ اور استخراج اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز