ڈیٹا پارسنگ اور استخراج ماڈل درجہ بندی

دیکھیں کہ ڈیٹا پارسنگ اور استخراج میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔

دکھائے گئے ماڈلز

اوسط ڈیٹا پارسنگ اور استخراج اسکور

8.9

بہترین ماڈل

DeepSeek V4 Flash 10.0

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ41 ناکامی کی وجہ API خرابی کے ساتھ14 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ8 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ6 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ1

210/210

درجہ	ماڈل	کمپنی	ڈیٹا پارسنگ اور استخراج اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#48	Grok Build 0.1 medium	X AI	10.0	7.6	$1.097	2/2	10.7s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $1.097 ردِعمل کا وقت (اوسط) 10.7s
#49	GLM 5 Turbo medium	Z.ai	10.0	7.6	$0.323	2/2	6.19s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.323 ردِعمل کا وقت (اوسط) 6.19s
#50	GPT-5.6 Luna medium	OpenAI	10.0	7.6	$0.352	2/2	1.95s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.352 ردِعمل کا وقت (اوسط) 1.95s
#51	Nemotron 3 Ultra medium	NVIDIA	10.0	7.5	$0.774	2/2	5.68s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.774 ردِعمل کا وقت (اوسط) 5.68s
#52	Kimi K2.7 Code medium	Moonshot AI	10.0	7.5	$0.751	2/2	12.3s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.751 ردِعمل کا وقت (اوسط) 12.3s
#53	GPT-5.4 Nano medium	OpenAI	10.0	7.5	$0.138	2/2	2.54s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.138 ردِعمل کا وقت (اوسط) 2.54s
#54	GPT-5.3 Chat none	OpenAI	10.0	7.5	$0.571	2/2	2.21s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.571 ردِعمل کا وقت (اوسط) 2.21s
#55	GPT-5.6 Terra low	OpenAI	10.0	7.5	$0.519	2/2	919ms
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.519 ردِعمل کا وقت (اوسط) 919ms
#56	GPT-5.4 Mini medium	OpenAI	10.0	7.5	$0.756	2/2	2.43s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.756 ردِعمل کا وقت (اوسط) 2.43s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	10.0	7.5	$0.437	2/2	46.9s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.437 ردِعمل کا وقت (اوسط) 46.9s
#58	Qwen3.5-27B medium	Qwen	10.0	7.4	$1.627	2/2	30.3s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $1.627 ردِعمل کا وقت (اوسط) 30.3s
#59	Qwen3.7 Max none	Qwen	10.0	7.4	$0.197	2/2	1.35s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.197 ردِعمل کا وقت (اوسط) 1.35s
#61	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.177	2/2	9.40s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.177 ردِعمل کا وقت (اوسط) 9.40s
#62	KAT-Coder-Pro V2.5 low	Kwaipilot	10.0	7.4	$0.387	2/2	4.19s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.387 ردِعمل کا وقت (اوسط) 4.19s
#63	Claude Sonnet 4.6 none	Anthropic	10.0	7.3	$0.661	2/2	3.43s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.661 ردِعمل کا وقت (اوسط) 3.43s

ڈیٹا پارسنگ اور استخراج درجہ بندی

ماڈلز فلٹر کریں

ڈیٹا پارسنگ اور استخراج اسکور کے لحاظ سے سرفہرست ماڈلز

ڈیٹا پارسنگ اور استخراج اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز