डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↑.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

MiMo-V2-Flash 6.5

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

210/210

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#113	MiMo-V2-Flash medium	Xiaomi	6.5	6.3	$0.043	1/2	0ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.043 प्रतिसाद वेळ (सरासरी) 0ms
#209	Step 3.5 Flash none	Stepfun	1.5	2.3	$0.020	0/1	0ms
एकूण चाचण्या 1 चुकीच्या चाचण्या 1 एकूण खर्च $0.020 प्रतिसाद वेळ (सरासरी) 0ms
#197	Grok 4.20 none	X AI	10.0	4.1	$0.057	2/2	522ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.057 प्रतिसाद वेळ (सरासरी) 522ms
#201	Granite 4.1 8B none	IBM Granite	3.0	4.0	$0.007	0/2	575ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.007 प्रतिसाद वेळ (सरासरी) 575ms
#191	Grok 4.20 Beta none	X AI	10.0	4.4	$0.087	2/2	601ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.087 प्रतिसाद वेळ (सरासरी) 601ms
#205	Laguna Xs.2 none	Poolside	10.0	3.8	$0.004	2/2	646ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.004 प्रतिसाद वेळ (सरासरी) 646ms
#118	Gemini 2.5 Flash none	Google	10.0	6.2	$0.017	2/2	652ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.017 प्रतिसाद वेळ (सरासरी) 652ms
#189	Mercury 2 none	Inception	7.3	4.6	$0.030	1/2	667ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.030 प्रतिसाद वेळ (सरासरी) 667ms
#210	LFM2-24B-A2B none	Liquid	3.0	2.2	$0.001	0/2	714ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.001 प्रतिसाद वेळ (सरासरी) 714ms
#159	GPT-5.6 Luna none	OpenAI	10.0	5.4	$0.142	2/2	758ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.142 प्रतिसाद वेळ (सरासरी) 758ms
#160	Laguna XS 2.1 none	Poolside	10.0	5.3	$0.008	2/2	768ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.008 प्रतिसाद वेळ (सरासरी) 768ms
#165	Mistral Small 4 none	Mistral	10.0	5.1	$0.022	2/2	822ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.022 प्रतिसाद वेळ (सरासरी) 822ms
#122	Gemini 3.1 Flash Lite none	Google	10.0	6.1	$0.046	2/2	843ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.046 प्रतिसाद वेळ (सरासरी) 843ms
#169	Qwen3.5-9B none	Qwen	10.0	5.1	$0.021	2/2	847ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.021 प्रतिसाद वेळ (सरासरी) 847ms
#39	GPT-5.6 Terra medium	OpenAI	10.0	7.8	$0.676	2/2	872ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.676 प्रतिसाद वेळ (सरासरी) 872ms

1 2 14

→

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स