डेटा पार्सिंग और निष्कर्षण मॉडल रैंकिंग

देखें कि डेटा पार्सिंग और निष्कर्षण में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↑.

दिखाए गए मॉडल

औसत डेटा पार्सिंग और निष्कर्षण स्कोर

8.9

सर्वश्रेष्ठ मॉडल

LongCat 2.0 3.6

विफलता के कारण

विफलता कारण गलत उत्तर के साथ41 विफलता कारण API त्रुटि के साथ14 विफलता कारण कोई उत्तर नहीं के साथ8 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ6 विफलता कारण समय समाप्त के साथ1

210/210

रैंक	मॉडल	कंपनी	डेटा पार्सिंग और निष्कर्षण स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#41	Claude Opus 4.8 low	Anthropic	6.3	7.8	$2.077	1/2	2.27s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $2.077 प्रतिक्रिया समय (औसत) 2.27s
#42	GLM 5 medium	Z.ai	7.1	7.7	$0.307	1/2	8.90s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.307 प्रतिक्रिया समय (औसत) 8.90s
#60	LongCat 2.0 medium	Meituan	6.3	7.4	$0.478	1/2	10.6s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.478 प्रतिक्रिया समय (औसत) 10.6s
#66	Claude Opus 4.8 none	Anthropic	7.3	7.3	$1.166	1/2	1.77s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $1.166 प्रतिक्रिया समय (औसत) 1.77s
#67	Step 3.7 Flash low	Stepfun	7.3	7.3	$0.454	1/2	2.29s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.454 प्रतिक्रिया समय (औसत) 2.29s
#78	Mercury 2 medium	Inception	7.3	7.0	$0.093	1/2	1.11s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.093 प्रतिक्रिया समय (औसत) 1.11s
#79	Gemini 3.5 Flash none	Google	6.5	7.0	$1.079	1/2	8.10s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $1.079 प्रतिक्रिया समय (औसत) 8.10s
#81	KAT-Coder-Pro V2.5 medium	Kwaipilot	7.3	6.9	$0.467	1/2	4.70s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.467 प्रतिक्रिया समय (औसत) 4.70s
#84	MiMo-V2.5-Pro medium	Xiaomi	7.3	6.9	$0.187	1/2	18.8s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.187 प्रतिक्रिया समय (औसत) 18.8s
#91	LongCat 2.0 low	Meituan	6.3	6.7	$0.391	1/2	10.8s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.391 प्रतिक्रिया समय (औसत) 10.8s
#100	Hy3 preview medium	Tencent	6.5	6.5	$0.018	1/2	5.25s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.018 प्रतिक्रिया समय (औसत) 5.25s
#108	Ring-2.6-1T medium	Inclusionai	6.5	6.3	$0.103	1/2	37.4s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.103 प्रतिक्रिया समय (औसत) 37.4s
#109	Mimo V2 PRO medium	Xiaomi	7.3	6.3	$0.333	1/2	17.2s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.333 प्रतिक्रिया समय (औसत) 17.2s
#113	MiMo-V2-Flash medium	Xiaomi	6.5	6.3	$0.043	1/2	0ms
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.043 प्रतिक्रिया समय (औसत) 0ms
#114	Qwen3.5-Flash medium	Qwen	7.3	6.2	$0.139	1/2	57.0s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.139 प्रतिक्रिया समय (औसत) 57.0s

डेटा पार्सिंग और निष्कर्षण रैंकिंग

मॉडल फ़िल्टर करें

डेटा पार्सिंग और निष्कर्षण स्कोर के अनुसार शीर्ष मॉडल

डेटा पार्सिंग और निष्कर्षण स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल