डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

DeepSeek V4 Flash 10.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

210/210

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#13	GPT-5.3-Codex medium	OpenAI	10.0	8.9	$0.920	2/2	3.07s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.920 प्रतिसाद वेळ (सरासरी) 3.07s
#15	Claude Opus 4.7 medium	Anthropic	10.0	8.7	$1.477	2/2	2.37s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.477 प्रतिसाद वेळ (सरासरी) 2.37s
#16	Muse Spark 1.1 medium	Meta	10.0	8.6	$1.357	2/2	4.96s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.357 प्रतिसाद वेळ (सरासरी) 4.96s
#17	Claude Fable 5 medium	Anthropic	10.0	8.6	$3.478	2/2	7.18s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $3.478 प्रतिसाद वेळ (सरासरी) 7.18s
#18	GPT-5.4 medium	OpenAI	10.0	8.5	$1.533	2/2	5.32s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.533 प्रतिसाद वेळ (सरासरी) 5.32s
#19	Qwen3.6 Max Preview medium	Qwen	10.0	8.4	$1.143	2/2	41.2s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.143 प्रतिसाद वेळ (सरासरी) 41.2s
#20	Grok 4.5 low	X AI	10.0	8.4	$0.935	2/2	3.44s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.935 प्रतिसाद वेळ (सरासरी) 3.44s
#21	GPT-5.2 medium	OpenAI	10.0	8.4	$0.951	2/2	3.15s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.951 प्रतिसाद वेळ (सरासरी) 3.15s
#22	Grok 4.5 medium	X AI	10.0	8.3	$1.928	2/2	6.29s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.928 प्रतिसाद वेळ (सरासरी) 6.29s
#23	Claude Sonnet 5 medium	Anthropic	10.0	8.3	$0.922	2/2	3.16s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.922 प्रतिसाद वेळ (सरासरी) 3.16s
#24	Muse Spark 1.1 low	Meta	10.0	8.3	$0.647	2/2	3.22s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.647 प्रतिसाद वेळ (सरासरी) 3.22s
#25	Gemini 2.5 Flash medium	Google	10.0	8.2	$0.643	2/2	4.06s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.643 प्रतिसाद वेळ (सरासरी) 4.06s
#26	GPT-5 Mini medium	OpenAI	10.0	8.1	$0.237	2/2	12.6s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.237 प्रतिसाद वेळ (सरासरी) 12.6s
#27	Muse Spark 1.1 high	Meta	10.0	8.1	$1.694	2/2	8.40s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.694 प्रतिसाद वेळ (सरासरी) 8.40s
#28	Inkling high	Thinkingmachines	10.0	8.0	$1.006	2/2	8.19s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.006 प्रतिसाद वेळ (सरासरी) 8.19s

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स