डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

DeepSeek V4 Flash 10.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

216/216

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#191	Grok 4.1 Fast medium	X AI	10.0	4.7	$0.069	2/2	6.63s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.069 प्रतिसाद वेळ (सरासरी) 6.63s
#192	Laguna M.1 medium	Poolside	10.0	4.7	$0.033	2/2	4.93s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.033 प्रतिसाद वेळ (सरासरी) 4.93s
#197	Grok 4.20 Beta none	X AI	10.0	4.4	$0.087	2/2	601ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.087 प्रतिसाद वेळ (सरासरी) 601ms
#198	Laguna M.1 none	Poolside	10.0	4.4	$0.009	2/2	3.37s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.009 प्रतिसाद वेळ (सरासरी) 3.37s
#202	Hunter Alpha none	OpenRouter	10.0	4.2	$0.000	2/2	8.49s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 8.49s
#203	Grok 4.20 none	X AI	10.0	4.1	$0.057	2/2	522ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.057 प्रतिसाद वेळ (सरासरी) 522ms
#209	Grok 4.1 Fast none	X AI	10.0	3.8	$0.008	2/2	943ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.008 प्रतिसाद वेळ (सरासरी) 943ms
#211	Laguna Xs.2 none	Poolside	10.0	3.8	$0.004	2/2	646ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.004 प्रतिसाद वेळ (सरासरी) 646ms
#82	Mercury 2 medium	Inception	7.3	7.0	$0.093	1/2	1.11s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.093 प्रतिसाद वेळ (सरासरी) 1.11s
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	7.3	6.9	$0.467	1/2	4.70s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.467 प्रतिसाद वेळ (सरासरी) 4.70s
#120	Qwen3.5-Flash medium	Qwen	7.3	6.2	$0.139	1/2	57.0s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.139 प्रतिसाद वेळ (सरासरी) 57.0s
#125	Qwen3.5-35B-A3B medium	Qwen	7.3	6.2	$0.837	1/2	59.3s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.837 प्रतिसाद वेळ (सरासरी) 59.3s
#173	Mistral Small 4 medium	Mistral	7.3	5.1	$0.096	1/2	1.23s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.096 प्रतिसाद वेळ (सरासरी) 1.23s
#195	Mercury 2 none	Inception	7.3	4.6	$0.030	1/2	667ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.030 प्रतिसाद वेळ (सरासरी) 667ms
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	7.3	3.4	$0.000	1/2	2.72s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 2.72s

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स