डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↓.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

Gemini 3.6 Flash 10.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

216/216

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#166	Laguna XS 2.1 none	Poolside	10.0	5.3	$0.008	2/2	768ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.008 प्रतिसाद वेळ (सरासरी) 768ms
#167	Qwen3.6 35B A3B none	Qwen	10.0	5.3	$0.061	2/2	1.46s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.061 प्रतिसाद वेळ (सरासरी) 1.46s
#168	Ling-2.6-1T none	Inclusionai	10.0	5.3	$0.016	2/2	1.37s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.016 प्रतिसाद वेळ (सरासरी) 1.37s
#169	Gemini 3.1 Flash Lite Preview high	Google	10.0	5.3	$2.310	2/2	7.16s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $2.310 प्रतिसाद वेळ (सरासरी) 7.16s
#170	Inkling none	Thinkingmachines	10.0	5.2	$0.147	2/2	1.14s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.147 प्रतिसाद वेळ (सरासरी) 1.14s
#171	Mistral Small 4 none	Mistral	10.0	5.1	$0.022	2/2	822ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.022 प्रतिसाद वेळ (सरासरी) 822ms
#175	Qwen3.5-9B none	Qwen	10.0	5.1	$0.021	2/2	847ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.021 प्रतिसाद वेळ (सरासरी) 847ms
#176	GLM 5 Turbo none	Z.ai	10.0	5.1	$0.047	2/2	2.47s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.047 प्रतिसाद वेळ (सरासरी) 2.47s
#177	North Mini Code none	Cohere	10.0	5.1	$0.000	2/2	28.0s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 28.0s
#180	GPT-4o-mini none	OpenAI	10.0	5.0	$0.010	2/2	1.27s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.010 प्रतिसाद वेळ (सरासरी) 1.27s
#181	Qwen3.6 Plus Preview medium	Qwen	10.0	4.9	$0.000	2/2	14.9s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 14.9s
#183	Nemotron 3 Super none	NVIDIA	10.0	4.9	$0.008	2/2	7.92s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.008 प्रतिसाद वेळ (सरासरी) 7.92s
#187	Grok 4.20 Multi Agent Beta medium	X AI	10.0	4.8	$5.599	2/2	5.54s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $5.599 प्रतिसाद वेळ (सरासरी) 5.54s
#189	Trinity Large Preview none	Arcee AI	10.0	4.8	$0.008	2/2	3.26s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.008 प्रतिसाद वेळ (सरासरी) 3.26s
#190	Hunter Alpha medium	OpenRouter	10.0	4.7	$0.000	2/2	23.2s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 23.2s

←

1 9 10 11 15

→

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स