डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: मेट्रिक ↑.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

Step 3.5 Flash 1.5

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

210/210

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#209	Step 3.5 Flash none	Stepfun	1.5	2.3	$0.020	0/1	0ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.020 प्रतिसाद वेळ (सरासरी) 0ms
#101	MiMo-V2.5 medium	Xiaomi	2.7	6.5	$0.082	0/2	6.33s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.082 प्रतिसाद वेळ (सरासरी) 6.33s
#200	MiMo-V2-Flash none	Xiaomi	2.9	4.0	$0.025	0/2	19.7s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.025 प्रतिसाद वेळ (सरासरी) 19.7s
#179	Ring-2.6-1T none	Inclusionai	3.0	4.8	$0.026	0/2	45.9s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.026 प्रतिसाद वेळ (सरासरी) 45.9s
#201	Granite 4.1 8B none	IBM Granite	3.0	4.0	$0.007	0/2	575ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.007 प्रतिसाद वेळ (सरासरी) 575ms
#210	LFM2-24B-A2B none	Liquid	3.0	2.2	$0.001	0/2	714ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.001 प्रतिसाद वेळ (सरासरी) 714ms
#99	Qwen3.6 27B medium	Qwen	3.5	6.5	$0.779	0/2	37.3s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.779 प्रतिसाद वेळ (सरासरी) 37.3s
#97	LongCat 2.0 high	Meituan	3.6	6.6	$0.469	0/2	11.0s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.469 प्रतिसाद वेळ (सरासरी) 11.0s
#204	Qwen3.5-9B medium	Qwen	3.6	3.8	$0.036	0/2	87.3s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.036 प्रतिसाद वेळ (सरासरी) 87.3s
#128	GPT-5 Nano medium	OpenAI	3.7	6.1	$0.114	0/2	21.4s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.114 प्रतिसाद वेळ (सरासरी) 21.4s
#202	Grok Build 0.1 none	X AI	3.8	4.0	$0.547	0/2	9.33s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.547 प्रतिसाद वेळ (सरासरी) 9.33s
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.8	3.2	$0.000	0/2	1.42s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 1.42s
#190	MiniMax M2.5 medium	Minimax	4.6	4.6	$0.340	0/2	7.48s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.340 प्रतिसाद वेळ (सरासरी) 7.48s
#60	LongCat 2.0 medium	Meituan	6.3	7.4	$0.478	1/2	10.6s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.478 प्रतिसाद वेळ (सरासरी) 10.6s
#91	LongCat 2.0 low	Meituan	6.3	6.7	$0.391	1/2	10.8s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.391 प्रतिसाद वेळ (सरासरी) 10.8s

1 2 14

→

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स