ڈیٹا پارسنگ اور استخراج ماڈل درجہ بندی

دیکھیں کہ ڈیٹا پارسنگ اور استخراج میں کون سے AI ماڈلز بہترین کارکردگی دکھاتے ہیں، کون سے قابلِ اعتماد رہتے ہیں، اور سب سے بڑے فرق کہاں نظر آتے ہیں۔ ترتیب دیں حسب: ردِعمل کا وقت (اوسط) ↓.

دکھائے گئے ماڈلز

اوسط ڈیٹا پارسنگ اور استخراج اسکور

8.9

بہترین ماڈل

Qwen3.5-9B 3.6

ناکامی کی وجوہات

ناکامی کی وجہ غلط جواب کے ساتھ41 ناکامی کی وجہ API خرابی کے ساتھ14 ناکامی کی وجہ کوئی جواب نہیں کے ساتھ8 ناکامی کی وجہ اضافی فارمیٹنگ کے ساتھ6 ناکامی کی وجہ ٹائم آؤٹ کے ساتھ1

216/216

درجہ	ماڈل	کمپنی	ڈیٹا پارسنگ اور استخراج اسکور	اسکور	کل لاگت	درست ٹیسٹس	ردِعمل کا وقت (اوسط)
#17	Claude Opus 4.8 medium	Anthropic	7.1	8.8	$1.931	1/2	12.3s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $1.931 ردِعمل کا وقت (اوسط) 12.3s
#56	Kimi K2.7 Code medium	Moonshot AI	10.0	7.5	$0.740	2/2	12.3s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.740 ردِعمل کا وقت (اوسط) 12.3s
#141	Hy3 preview high	Tencent	6.5	5.9	$0.048	1/2	12.1s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.048 ردِعمل کا وقت (اوسط) 12.1s
#102	LongCat 2.0 high	Meituan	3.6	6.6	$0.469	0/2	11.0s
کل ٹیسٹس 2 غلط ٹیسٹس 2 کل لاگت $0.469 ردِعمل کا وقت (اوسط) 11.0s
#139	Gemini 3 PRO Preview medium	Google	10.0	6.0	$0.385	2/2	10.8s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.385 ردِعمل کا وقت (اوسط) 10.8s
#96	LongCat 2.0 low	Meituan	6.3	6.7	$0.391	1/2	10.8s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.391 ردِعمل کا وقت (اوسط) 10.8s
#52	Grok Build 0.1 medium	X AI	10.0	7.6	$1.097	2/2	10.7s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $1.097 ردِعمل کا وقت (اوسط) 10.7s
#64	LongCat 2.0 medium	Meituan	6.3	7.4	$0.478	1/2	10.6s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.478 ردِعمل کا وقت (اوسط) 10.6s
#89	Qwen3.6 Flash medium	Qwen	10.0	6.9	$0.738	2/2	9.65s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.738 ردِعمل کا وقت (اوسط) 9.65s
#98	GLM 5V Turbo medium	Z.ai	10.0	6.7	$0.457	2/2	9.60s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.457 ردِعمل کا وقت (اوسط) 9.60s
#179	DeepSeek V3.2 none	DeepSeek	6.3	5.0	$0.054	1/2	9.42s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.054 ردِعمل کا وقت (اوسط) 9.42s
#65	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.177	2/2	9.40s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.177 ردِعمل کا وقت (اوسط) 9.40s
#204	Laguna Xs.2 medium	Poolside	7.1	4.1	$0.015	1/2	9.34s
کل ٹیسٹس 2 غلط ٹیسٹس 1 کل لاگت $0.015 ردِعمل کا وقت (اوسط) 9.34s
#78	GLM 5.1 medium	Z.ai	10.0	7.1	$0.535	2/2	9.33s
کل ٹیسٹس 2 غلط ٹیسٹس 0 کل لاگت $0.535 ردِعمل کا وقت (اوسط) 9.33s
#208	Grok Build 0.1 none	X AI	3.8	4.0	$0.547	0/2	9.33s
کل ٹیسٹس 2 غلط ٹیسٹس 2 کل لاگت $0.547 ردِعمل کا وقت (اوسط) 9.33s

ڈیٹا پارسنگ اور استخراج درجہ بندی

ماڈلز فلٹر کریں

ڈیٹا پارسنگ اور استخراج اسکور کے لحاظ سے سرفہرست ماڈلز

ڈیٹا پارسنگ اور استخراج اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط) کے لحاظ سے سرفہرست ماڈلز