डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↑.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

MiMo-V2-Flash 6.5

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

216/216

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#71	Step 3.7 Flash low	Stepfun	7.3	7.3	$0.454	1/2	2.29s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.454 प्रतिसाद वेळ (सरासरी) 2.29s
#68	Gemini 3.1 Flash Lite Preview medium	Google	10.0	7.3	$0.115	2/2	2.29s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.115 प्रतिसाद वेळ (सरासरी) 2.29s
#117	LongCat 2.0 none	Meituan	10.0	6.3	$0.044	2/2	2.36s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.044 प्रतिसाद वेळ (सरासरी) 2.36s
#18	Claude Opus 4.7 medium	Anthropic	10.0	8.7	$1.477	2/2	2.37s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.477 प्रतिसाद वेळ (सरासरी) 2.37s
#60	GPT-5.4 Mini medium	OpenAI	10.0	7.5	$0.756	2/2	2.43s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.756 प्रतिसाद वेळ (सरासरी) 2.43s
#176	GLM 5 Turbo none	Z.ai	10.0	5.1	$0.047	2/2	2.47s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.047 प्रतिसाद वेळ (सरासरी) 2.47s
#57	GPT-5.4 Nano medium	OpenAI	10.0	7.5	$0.138	2/2	2.54s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.138 प्रतिसाद वेळ (सरासरी) 2.54s
#69	Gemini 3.1 Flash Lite medium	Google	10.0	7.3	$0.117	2/2	2.60s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.117 प्रतिसाद वेळ (सरासरी) 2.60s
#188	KAT-Coder-Air V2.5 none	Kwaipilot	6.3	4.8	$0.067	1/2	2.66s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.067 प्रतिसाद वेळ (सरासरी) 2.66s
#31	Gemini 3.5 Flash-Lite high	Google	10.0	8.1	$0.584	2/2	2.71s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.584 प्रतिसाद वेळ (सरासरी) 2.71s
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	7.3	3.4	$0.000	1/2	2.72s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 2.72s
#33	Step 3.7 Flash medium	Stepfun	10.0	8.0	$0.515	2/2	2.75s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.515 प्रतिसाद वेळ (सरासरी) 2.75s
#164	KAT-Coder-Air V2.5 low	Kwaipilot	6.5	5.4	$0.041	1/2	2.82s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.041 प्रतिसाद वेळ (सरासरी) 2.82s
#132	Qwen3.5 Plus 2026-04-20 none	Qwen	10.0	6.1	$0.122	2/2	2.82s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.122 प्रतिसाद वेळ (सरासरी) 2.82s
#205	Hy3 preview none	Tencent	6.5	4.0	$0.003	1/2	2.85s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.003 प्रतिसाद वेळ (सरासरी) 2.85s

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स