डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↓.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

Gemini 3.6 Flash 10.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

216/216

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#191	Grok 4.1 Fast medium	X AI	10.0	4.7	$0.069	2/2	6.63s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.069 प्रतिसाद वेळ (सरासरी) 6.63s
#192	Laguna M.1 medium	Poolside	10.0	4.7	$0.033	2/2	4.93s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.033 प्रतिसाद वेळ (सरासरी) 4.93s
#197	Grok 4.20 Beta none	X AI	10.0	4.4	$0.087	2/2	601ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.087 प्रतिसाद वेळ (सरासरी) 601ms
#198	Laguna M.1 none	Poolside	10.0	4.4	$0.009	2/2	3.37s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.009 प्रतिसाद वेळ (सरासरी) 3.37s
#202	Hunter Alpha none	OpenRouter	10.0	4.2	$0.000	2/2	8.49s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 8.49s
#203	Grok 4.20 none	X AI	10.0	4.1	$0.057	2/2	522ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.057 प्रतिसाद वेळ (सरासरी) 522ms
#209	Grok 4.1 Fast none	X AI	10.0	3.8	$0.008	2/2	943ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.008 प्रतिसाद वेळ (सरासरी) 943ms
#211	Laguna Xs.2 none	Poolside	10.0	3.8	$0.004	2/2	646ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.004 प्रतिसाद वेळ (सरासरी) 646ms
#17	Claude Opus 4.8 medium	Anthropic	7.1	8.8	$1.931	1/2	12.3s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $1.931 प्रतिसाद वेळ (सरासरी) 12.3s
#37	Kimi K3 max	Moonshot AI	7.3	8.0	$3.112	1/2	16.7s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $3.112 प्रतिसाद वेळ (सरासरी) 16.7s
#45	Claude Opus 4.8 low	Anthropic	6.3	7.8	$2.077	1/2	2.27s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $2.077 प्रतिसाद वेळ (सरासरी) 2.27s
#46	GLM 5 medium	Z.ai	7.1	7.7	$0.307	1/2	8.90s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.307 प्रतिसाद वेळ (सरासरी) 8.90s
#64	LongCat 2.0 medium	Meituan	6.3	7.4	$0.478	1/2	10.6s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.478 प्रतिसाद वेळ (सरासरी) 10.6s
#70	Claude Opus 4.8 none	Anthropic	7.3	7.3	$1.166	1/2	1.77s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $1.166 प्रतिसाद वेळ (सरासरी) 1.77s
#71	Step 3.7 Flash low	Stepfun	7.3	7.3	$0.454	1/2	2.29s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.454 प्रतिसाद वेळ (सरासरी) 2.29s

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स