डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↑.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

MiMo-V2-Flash 6.5

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

216/216

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#103	Qwen3.6 Max Preview none	Qwen	10.0	6.6	$0.231	2/2	2.87s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.231 प्रतिसाद वेळ (सरासरी) 2.87s
#110	Gemini 3.1 Flash Lite Preview low	Google	10.0	6.5	$0.646	2/2	3.00s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.646 प्रतिसाद वेळ (सरासरी) 3.00s
#118	Claude Sonnet 5 none	Anthropic	10.0	6.3	$0.548	2/2	3.01s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.548 प्रतिसाद वेळ (सरासरी) 3.01s
#140	Mimo V2 Omni medium	Xiaomi	10.0	5.9	$0.683	2/2	3.04s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.683 प्रतिसाद वेळ (सरासरी) 3.04s
#34	GPT-5.2 Chat none	OpenAI	10.0	8.0	$0.604	2/2	3.05s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.604 प्रतिसाद वेळ (सरासरी) 3.05s
#16	GPT-5.3-Codex medium	OpenAI	10.0	8.9	$0.920	2/2	3.07s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.920 प्रतिसाद वेळ (सरासरी) 3.07s
#24	GPT-5.2 medium	OpenAI	10.0	8.4	$0.951	2/2	3.15s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.951 प्रतिसाद वेळ (सरासरी) 3.15s
#26	Claude Sonnet 5 medium	Anthropic	10.0	8.3	$0.922	2/2	3.16s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.922 प्रतिसाद वेळ (सरासरी) 3.16s
#27	Muse Spark 1.1 low	Meta	10.0	8.3	$0.647	2/2	3.22s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.647 प्रतिसाद वेळ (सरासरी) 3.22s
#189	Trinity Large Preview none	Arcee AI	10.0	4.8	$0.008	2/2	3.26s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.008 प्रतिसाद वेळ (सरासरी) 3.26s
#9	GPT-5.5 low	OpenAI	10.0	9.3	$1.253	2/2	3.28s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.253 प्रतिसाद वेळ (सरासरी) 3.28s
#198	Laguna M.1 none	Poolside	10.0	4.4	$0.009	2/2	3.37s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.009 प्रतिसाद वेळ (सरासरी) 3.37s
#67	Claude Sonnet 4.6 none	Anthropic	10.0	7.3	$0.661	2/2	3.43s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.661 प्रतिसाद वेळ (सरासरी) 3.43s
#23	Grok 4.5 low	X AI	10.0	8.4	$0.935	2/2	3.44s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.935 प्रतिसाद वेळ (सरासरी) 3.44s
#150	KAT-Coder-Air V2.5 high	Kwaipilot	6.5	5.6	$0.077	1/2	3.59s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.077 प्रतिसाद वेळ (सरासरी) 3.59s

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स