ڈیٹا پارسنگ اور استخراج ماڈل درجہ بندی

دیکھیں کہ ڈیٹا پارسنگ اور استخراج میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: درست ٹیسٹس ↓.

دکھائے گئے ماڈلز

اوسط ڈیٹا پارسنگ اور استخراج اسکور

8.9

بہترین ماڈل

Gemini 3.6 Flash 10.0

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ41 ناکامی کی وجہ API خرابی کے ساتھ14 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ8 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ6 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ1

216/216

درجہ	ماڈل	کمپنی	ڈیٹا پارسنگ اور استخراج اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#166	Laguna XS 2.1 none	Poolside	10.0	5.3	$0.008	2/2	768ms
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.008 ردِعمل کا وقت (اوسط) 768ms
#167	Qwen3.6 35B A3B none	Qwen	10.0	5.3	$0.061	2/2	1.46s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.061 ردِعمل کا وقت (اوسط) 1.46s
#168	Ling-2.6-1T none	Inclusionai	10.0	5.3	$0.016	2/2	1.37s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.016 ردِعمل کا وقت (اوسط) 1.37s
#169	Gemini 3.1 Flash Lite Preview high	Google	10.0	5.3	$2.310	2/2	7.16s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $2.310 ردِعمل کا وقت (اوسط) 7.16s
#170	Inkling none	Thinkingmachines	10.0	5.2	$0.147	2/2	1.14s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.147 ردِعمل کا وقت (اوسط) 1.14s
#171	Mistral Small 4 none	Mistral	10.0	5.1	$0.022	2/2	822ms
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.022 ردِعمل کا وقت (اوسط) 822ms
#175	Qwen3.5-9B none	Qwen	10.0	5.1	$0.021	2/2	847ms
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.021 ردِعمل کا وقت (اوسط) 847ms
#176	GLM 5 Turbo none	Z.ai	10.0	5.1	$0.047	2/2	2.47s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.047 ردِعمل کا وقت (اوسط) 2.47s
#177	North Mini Code none	Cohere	10.0	5.1	$0.000	2/2	28.0s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 28.0s
#180	GPT-4o-mini none	OpenAI	10.0	5.0	$0.010	2/2	1.27s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.010 ردِعمل کا وقت (اوسط) 1.27s
#181	Qwen3.6 Plus Preview medium	Qwen	10.0	4.9	$0.000	2/2	14.9s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 14.9s
#183	Nemotron 3 Super none	NVIDIA	10.0	4.9	$0.008	2/2	7.92s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.008 ردِعمل کا وقت (اوسط) 7.92s
#187	Grok 4.20 Multi Agent Beta medium	X AI	10.0	4.8	$5.599	2/2	5.54s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $5.599 ردِعمل کا وقت (اوسط) 5.54s
#189	Trinity Large Preview none	Arcee AI	10.0	4.8	$0.008	2/2	3.26s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.008 ردِعمل کا وقت (اوسط) 3.26s
#190	Hunter Alpha medium	OpenRouter	10.0	4.7	$0.000	2/2	23.2s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.000 ردِعمل کا وقت (اوسط) 23.2s

←

1 9 10 11 15

→

ڈیٹا پارسنگ اور استخراج درجہ بندی

ماڈلز فلٹر کریں

ڈیٹا پارسنگ اور استخراج اسکور کے لحاظ سے سرفہرست ماڈلز

ڈیٹا پارسنگ اور استخراج اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز