डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: मेट्रिक ↑.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

Step 3.5 Flash 1.5

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

216/216

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#19	Muse Spark 1.1 medium	Meta	10.0	8.6	$1.357	2/2	4.96s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.357 प्रतिसाद वेळ (सरासरी) 4.96s
#20	Claude Fable 5 medium	Anthropic	10.0	8.6	$3.478	2/2	7.18s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $3.478 प्रतिसाद वेळ (सरासरी) 7.18s
#21	GPT-5.4 medium	OpenAI	10.0	8.5	$1.533	2/2	5.32s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.533 प्रतिसाद वेळ (सरासरी) 5.32s
#22	Qwen3.6 Max Preview medium	Qwen	10.0	8.4	$1.143	2/2	41.2s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.143 प्रतिसाद वेळ (सरासरी) 41.2s
#23	Grok 4.5 low	X AI	10.0	8.4	$0.935	2/2	3.44s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.935 प्रतिसाद वेळ (सरासरी) 3.44s
#24	GPT-5.2 medium	OpenAI	10.0	8.4	$0.951	2/2	3.15s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.951 प्रतिसाद वेळ (सरासरी) 3.15s
#25	Grok 4.5 medium	X AI	10.0	8.3	$1.928	2/2	6.29s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.928 प्रतिसाद वेळ (सरासरी) 6.29s
#26	Claude Sonnet 5 medium	Anthropic	10.0	8.3	$0.922	2/2	3.16s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.922 प्रतिसाद वेळ (सरासरी) 3.16s
#27	Muse Spark 1.1 low	Meta	10.0	8.3	$0.647	2/2	3.22s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.647 प्रतिसाद वेळ (सरासरी) 3.22s
#28	Gemini 2.5 Flash medium	Google	10.0	8.2	$0.643	2/2	4.06s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.643 प्रतिसाद वेळ (सरासरी) 4.06s
#29	GPT-5 Mini medium	OpenAI	10.0	8.1	$0.237	2/2	12.6s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.237 प्रतिसाद वेळ (सरासरी) 12.6s
#30	Muse Spark 1.1 high	Meta	10.0	8.1	$1.694	2/2	8.40s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.694 प्रतिसाद वेळ (सरासरी) 8.40s
#31	Gemini 3.5 Flash-Lite high	Google	10.0	8.1	$0.584	2/2	2.71s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.584 प्रतिसाद वेळ (सरासरी) 2.71s
#32	Inkling high	Thinkingmachines	10.0	8.0	$1.006	2/2	8.19s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.006 प्रतिसाद वेळ (सरासरी) 8.19s
#33	Step 3.7 Flash medium	Stepfun	10.0	8.0	$0.515	2/2	2.75s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.515 प्रतिसाद वेळ (सरासरी) 2.75s

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स