डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↓.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

Qwen3.5-9B 3.6

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

210/210

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#204	Qwen3.5-9B medium	Qwen	3.6	3.8	$0.036	0/2	87.3s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.036 प्रतिसाद वेळ (सरासरी) 87.3s
#187	Qwen3 Coder Next medium	Qwen	6.5	4.7	$0.032	1/2	81.8s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.032 प्रतिसाद वेळ (सरासरी) 81.8s
#119	Qwen3.5-35B-A3B medium	Qwen	7.3	6.2	$0.837	1/2	59.3s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.837 प्रतिसाद वेळ (सरासरी) 59.3s
#114	Qwen3.5-Flash medium	Qwen	7.3	6.2	$0.139	1/2	57.0s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.139 प्रतिसाद वेळ (सरासरी) 57.0s
#77	Kimi K2.5 medium	Moonshot AI	10.0	7.0	$0.600	2/2	49.8s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.600 प्रतिसाद वेळ (सरासरी) 49.8s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	10.0	7.5	$0.437	2/2	46.9s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.437 प्रतिसाद वेळ (सरासरी) 46.9s
#179	Ring-2.6-1T none	Inclusionai	3.0	4.8	$0.026	0/2	45.9s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.026 प्रतिसाद वेळ (सरासरी) 45.9s
#155	Kimi K2.5 none	Moonshot AI	7.3	5.5	$0.127	1/2	42.1s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.127 प्रतिसाद वेळ (सरासरी) 42.1s
#19	Qwen3.6 Max Preview medium	Qwen	10.0	8.4	$1.143	2/2	41.2s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.143 प्रतिसाद वेळ (सरासरी) 41.2s
#70	Qwen3.5 Plus 2026-04-20 medium	Qwen	10.0	7.2	$0.317	2/2	38.3s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.317 प्रतिसाद वेळ (सरासरी) 38.3s
#108	Ring-2.6-1T medium	Inclusionai	6.5	6.3	$0.103	1/2	37.4s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.103 प्रतिसाद वेळ (सरासरी) 37.4s
#99	Qwen3.6 27B medium	Qwen	3.5	6.5	$0.779	0/2	37.3s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.779 प्रतिसाद वेळ (सरासरी) 37.3s
#76	DeepSeek V3.2 medium	DeepSeek	10.0	7.0	$0.078	2/2	36.1s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.078 प्रतिसाद वेळ (सरासरी) 36.1s
#58	Qwen3.5-27B medium	Qwen	10.0	7.4	$1.627	2/2	30.3s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.627 प्रतिसाद वेळ (सरासरी) 30.3s
#45	DeepSeek V4 Flash high	DeepSeek	10.0	7.7	$0.042	2/2	28.0s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.042 प्रतिसाद वेळ (सरासरी) 28.0s

1 2 14

→

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स