डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: मेट्रिक ↑.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

Step 3.5 Flash 1.5

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

210/210

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#194	GLM 4.7 Flash medium	Z.ai	6.3	4.3	$0.166	1/2	1.51s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.166 प्रतिसाद वेळ (सरासरी) 1.51s
#41	Claude Opus 4.8 low	Anthropic	6.3	7.8	$2.077	1/2	2.27s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $2.077 प्रतिसाद वेळ (सरासरी) 2.27s
#172	MiniMax M2.7 medium	Minimax	6.3	5.0	$0.163	1/2	21.9s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.163 प्रतिसाद वेळ (सरासरी) 21.9s
#173	DeepSeek V3.2 none	DeepSeek	6.3	5.0	$0.054	1/2	9.42s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.054 प्रतिसाद वेळ (सरासरी) 9.42s
#182	KAT-Coder-Air V2.5 none	Kwaipilot	6.3	4.8	$0.067	1/2	2.66s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.067 प्रतिसाद वेळ (सरासरी) 2.66s
#188	Cobuddy medium	Baidu	6.3	4.7	$0.000	1/2	17.4s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 17.4s
#121	gpt-oss-120b medium	OpenAI	6.4	6.1	$0.019	1/2	1.98s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.019 प्रतिसाद वेळ (सरासरी) 1.98s
#108	Ring-2.6-1T medium	Inclusionai	6.5	6.3	$0.103	1/2	37.4s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.103 प्रतिसाद वेळ (सरासरी) 37.4s
#144	KAT-Coder-Air V2.5 high	Kwaipilot	6.5	5.6	$0.077	1/2	3.59s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.077 प्रतिसाद वेळ (सरासरी) 3.59s
#149	KAT-Coder-Air V2.5 medium	Kwaipilot	6.5	5.6	$0.048	1/2	3.65s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.048 प्रतिसाद वेळ (सरासरी) 3.65s
#158	KAT-Coder-Air V2.5 low	Kwaipilot	6.5	5.4	$0.041	1/2	2.82s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.041 प्रतिसाद वेळ (सरासरी) 2.82s
#166	Qwen3 Coder Next none	Qwen	6.5	5.1	$0.025	1/2	1.32s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.025 प्रतिसाद वेळ (सरासरी) 1.32s
#178	Ling-2.6-flash none	Inclusionai	6.5	4.9	$0.002	1/2	8.48s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.002 प्रतिसाद वेळ (सरासरी) 8.48s
#180	GPT-5.4 Nano none	OpenAI	6.5	4.8	$0.041	1/2	1.11s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.041 प्रतिसाद वेळ (सरासरी) 1.11s
#187	Qwen3 Coder Next medium	Qwen	6.5	4.7	$0.032	1/2	81.8s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.032 प्रतिसाद वेळ (सरासरी) 81.8s

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स