डेटा पार्सिंग और निष्कर्षण मॉडल रैंकिंग

देखें कि डेटा पार्सिंग और निष्कर्षण में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.

दिखाए गए मॉडल

औसत डेटा पार्सिंग और निष्कर्षण स्कोर

8.9

सर्वश्रेष्ठ मॉडल

MiMo-V2-Flash 6.5

विफलता के कारण

विफलता कारण गलत उत्तर के साथ41 विफलता कारण API त्रुटि के साथ14 विफलता कारण कोई उत्तर नहीं के साथ8 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ6 विफलता कारण समय समाप्त के साथ1

216/216

रैंक	मॉडल	कंपनी	डेटा पार्सिंग और निष्कर्षण स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#71	Step 3.7 Flash low	Stepfun	7.3	7.3	$0.454	1/2	2.29s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.454 प्रतिक्रिया समय (औसत) 2.29s
#68	Gemini 3.1 Flash Lite Preview medium	Google	10.0	7.3	$0.115	2/2	2.29s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.115 प्रतिक्रिया समय (औसत) 2.29s
#117	LongCat 2.0 none	Meituan	10.0	6.3	$0.044	2/2	2.36s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.044 प्रतिक्रिया समय (औसत) 2.36s
#18	Claude Opus 4.7 medium	Anthropic	10.0	8.7	$1.477	2/2	2.37s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $1.477 प्रतिक्रिया समय (औसत) 2.37s
#60	GPT-5.4 Mini medium	OpenAI	10.0	7.5	$0.756	2/2	2.43s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.756 प्रतिक्रिया समय (औसत) 2.43s
#176	GLM 5 Turbo none	Z.ai	10.0	5.1	$0.047	2/2	2.47s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.047 प्रतिक्रिया समय (औसत) 2.47s
#57	GPT-5.4 Nano medium	OpenAI	10.0	7.5	$0.138	2/2	2.54s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.138 प्रतिक्रिया समय (औसत) 2.54s
#69	Gemini 3.1 Flash Lite medium	Google	10.0	7.3	$0.117	2/2	2.60s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.117 प्रतिक्रिया समय (औसत) 2.60s
#188	KAT-Coder-Air V2.5 none	Kwaipilot	6.3	4.8	$0.067	1/2	2.66s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.067 प्रतिक्रिया समय (औसत) 2.66s
#31	Gemini 3.5 Flash-Lite high	Google	10.0	8.1	$0.584	2/2	2.71s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.584 प्रतिक्रिया समय (औसत) 2.71s
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	7.3	3.4	$0.000	1/2	2.72s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 2.72s
#33	Step 3.7 Flash medium	Stepfun	10.0	8.0	$0.515	2/2	2.75s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.515 प्रतिक्रिया समय (औसत) 2.75s
#164	KAT-Coder-Air V2.5 low	Kwaipilot	6.5	5.4	$0.041	1/2	2.82s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.041 प्रतिक्रिया समय (औसत) 2.82s
#132	Qwen3.5 Plus 2026-04-20 none	Qwen	10.0	6.1	$0.122	2/2	2.82s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.122 प्रतिक्रिया समय (औसत) 2.82s
#205	Hy3 preview none	Tencent	6.5	4.0	$0.003	1/2	2.85s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.003 प्रतिक्रिया समय (औसत) 2.85s

डेटा पार्सिंग और निष्कर्षण रैंकिंग

मॉडल फ़िल्टर करें

डेटा पार्सिंग और निष्कर्षण स्कोर के अनुसार शीर्ष मॉडल

डेटा पार्सिंग और निष्कर्षण स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल