डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↑.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

LongCat 2.0 3.6

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

216/216

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#34	GPT-5.2 Chat none	OpenAI	10.0	8.0	$0.604	2/2	3.05s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.604 प्रतिसाद वेळ (सरासरी) 3.05s
#35	GLM 5.2 high	Z.ai	10.0	8.0	$0.817	2/2	5.81s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.817 प्रतिसाद वेळ (सरासरी) 5.81s
#36	Inkling medium	Thinkingmachines	10.0	8.0	$0.391	2/2	3.60s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.391 प्रतिसाद वेळ (सरासरी) 3.60s
#38	GPT-5.6 Terra high	OpenAI	10.0	8.0	$1.055	2/2	938ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.055 प्रतिसाद वेळ (सरासरी) 938ms
#39	Seed-2.0-Lite medium	Bytedance Seed	10.0	7.9	$0.234	2/2	9.07s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.234 प्रतिसाद वेळ (सरासरी) 9.07s
#40	Qwen3.7 Plus medium	Qwen	10.0	7.9	$0.267	2/2	21.7s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.267 प्रतिसाद वेळ (सरासरी) 21.7s
#41	Qwen3.6 Plus medium	Qwen	10.0	7.8	$0.405	2/2	14.9s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.405 प्रतिसाद वेळ (सरासरी) 14.9s
#42	GLM 5.2 medium	Z.ai	10.0	7.8	$0.187	2/2	13.4s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.187 प्रतिसाद वेळ (सरासरी) 13.4s
#43	GPT-5.6 Terra medium	OpenAI	10.0	7.8	$0.676	2/2	872ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.676 प्रतिसाद वेळ (सरासरी) 872ms
#44	Claude Sonnet 4.6 medium	Anthropic	10.0	7.8	$2.057	2/2	13.9s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $2.057 प्रतिसाद वेळ (सरासरी) 13.9s
#47	Claude Opus 4.6 medium	Anthropic	10.0	7.7	$3.059	2/2	7.37s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $3.059 प्रतिसाद वेळ (सरासरी) 7.37s
#48	GPT-5.6 Luna high	OpenAI	10.0	7.7	$1.017	2/2	2.18s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.017 प्रतिसाद वेळ (सरासरी) 2.18s
#49	DeepSeek V4 Flash high	DeepSeek	10.0	7.7	$0.041	2/2	28.0s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.041 प्रतिसाद वेळ (सरासरी) 28.0s
#50	DeepSeek V4 Pro high	DeepSeek	10.0	7.7	$0.200	2/2	25.0s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.200 प्रतिसाद वेळ (सरासरी) 25.0s
#51	MiniMax M3 medium	Minimax	10.0	7.6	$0.286	2/2	14.9s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.286 प्रतिसाद वेळ (सरासरी) 14.9s

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स