डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↑.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

LongCat 2.0 3.6

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

210/210

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#97	LongCat 2.0 high	Meituan	3.6	6.6	$0.469	0/2	11.0s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.469 प्रतिसाद वेळ (सरासरी) 11.0s
#99	Qwen3.6 27B medium	Qwen	3.5	6.5	$0.779	0/2	37.3s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.779 प्रतिसाद वेळ (सरासरी) 37.3s
#101	MiMo-V2.5 medium	Xiaomi	2.7	6.5	$0.082	0/2	6.33s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.082 प्रतिसाद वेळ (सरासरी) 6.33s
#128	GPT-5 Nano medium	OpenAI	3.7	6.1	$0.114	0/2	21.4s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.114 प्रतिसाद वेळ (सरासरी) 21.4s
#179	Ring-2.6-1T none	Inclusionai	3.0	4.8	$0.026	0/2	45.9s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.026 प्रतिसाद वेळ (सरासरी) 45.9s
#190	MiniMax M2.5 medium	Minimax	4.6	4.6	$0.340	0/2	7.48s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.340 प्रतिसाद वेळ (सरासरी) 7.48s
#200	MiMo-V2-Flash none	Xiaomi	2.9	4.0	$0.025	0/2	19.7s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.025 प्रतिसाद वेळ (सरासरी) 19.7s
#201	Granite 4.1 8B none	IBM Granite	3.0	4.0	$0.007	0/2	575ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.007 प्रतिसाद वेळ (सरासरी) 575ms
#202	Grok Build 0.1 none	X AI	3.8	4.0	$0.547	0/2	9.33s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.547 प्रतिसाद वेळ (सरासरी) 9.33s
#204	Qwen3.5-9B medium	Qwen	3.6	3.8	$0.036	0/2	87.3s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.036 प्रतिसाद वेळ (सरासरी) 87.3s
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	3.8	3.2	$0.000	0/2	1.42s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 1.42s
#209	Step 3.5 Flash none	Stepfun	1.5	2.3	$0.020	0/1	0ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.020 प्रतिसाद वेळ (सरासरी) 0ms
#210	LFM2-24B-A2B none	Liquid	3.0	2.2	$0.001	0/2	714ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.001 प्रतिसाद वेळ (सरासरी) 714ms
#14	Claude Opus 4.8 medium	Anthropic	7.1	8.8	$1.931	1/2	12.3s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $1.931 प्रतिसाद वेळ (सरासरी) 12.3s
#33	Kimi K3 max	Moonshot AI	7.3	8.0	$3.112	1/2	16.7s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $3.112 प्रतिसाद वेळ (सरासरी) 16.7s

1 2 14

→

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स