ڈیٹا پارسنگ اور استخراج ماڈل درجہ بندی

دیکھیں کہ ڈیٹا پارسنگ اور استخراج میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: درست ٹیسٹس ↓.

دکھائے گئے ماڈلز

اوسط ڈیٹا پارسنگ اور استخراج اسکور

8.9

بہترین ماڈل

Gemini 3.6 Flash 10.0

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ41 ناکامی کی وجہ API خرابی کے ساتھ14 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ8 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ6 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ1

216/216

درجہ	ماڈل	کمپنی	ڈیٹا پارسنگ اور استخراج اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#86	DeepSeek V4 Pro none	DeepSeek	10.0	6.9	$0.096	2/2	4.61s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.096 ردِعمل کا وقت (اوسط) 4.61s
#87	GPT-5.6 Sol none	OpenAI	10.0	6.9	$0.524	2/2	1.53s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.524 ردِعمل کا وقت (اوسط) 1.53s
#89	Qwen3.6 Flash medium	Qwen	10.0	6.9	$0.738	2/2	9.65s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.738 ردِعمل کا وقت (اوسط) 9.65s
#90	Step 3.7 Flash high	Stepfun	10.0	6.9	$1.207	2/2	14.7s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $1.207 ردِعمل کا وقت (اوسط) 14.7s
#91	GPT-5.5 none	OpenAI	10.0	6.9	$0.544	2/2	1.18s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.544 ردِعمل کا وقت (اوسط) 1.18s
#92	Gemini 3.5 Flash minimal	Google	10.0	6.8	$0.300	2/2	1.66s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.300 ردِعمل کا وقت (اوسط) 1.66s
#93	Gemini 3 Flash Preview none	Google	10.0	6.8	$0.085	2/2	1.41s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.085 ردِعمل کا وقت (اوسط) 1.41s
#94	Qwen3.6 35B A3B medium	Qwen	10.0	6.7	$0.746	2/2	13.0s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.746 ردِعمل کا وقت (اوسط) 13.0s
#95	Gemini 3.5 Flash-Lite low	Google	10.0	6.7	$0.145	2/2	657ms
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.145 ردِعمل کا وقت (اوسط) 657ms
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	10.0	6.7	$0.476	2/2	5.07s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.476 ردِعمل کا وقت (اوسط) 5.07s
#98	GLM 5V Turbo medium	Z.ai	10.0	6.7	$0.457	2/2	9.60s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.457 ردِعمل کا وقت (اوسط) 9.60s
#99	Claude Opus 4.7 none	Anthropic	10.0	6.6	$0.505	2/2	2.15s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.505 ردِعمل کا وقت (اوسط) 2.15s
#100	Gemma 4 26B A4B medium	Google	10.0	6.6	$0.089	2/2	16.5s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.089 ردِعمل کا وقت (اوسط) 16.5s
#101	GLM 5.2 none	Z.ai	10.0	6.6	$0.128	2/2	7.17s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.128 ردِعمل کا وقت (اوسط) 7.17s
#103	Qwen3.6 Max Preview none	Qwen	10.0	6.6	$0.231	2/2	2.87s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.231 ردِعمل کا وقت (اوسط) 2.87s

ڈیٹا پارسنگ اور استخراج درجہ بندی

ماڈلز فلٹر کریں

ڈیٹا پارسنگ اور استخراج اسکور کے لحاظ سے سرفہرست ماڈلز

ڈیٹا پارسنگ اور استخراج اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز