डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↓.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

Qwen3.5-9B 3.6

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

216/216

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#169	Gemini 3.1 Flash Lite Preview high	Google	10.0	5.3	$2.310	2/2	7.16s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $2.310 प्रतिसाद वेळ (सरासरी) 7.16s
#212	gpt-oss-120b none	OpenAI	6.5	3.7	$0.010	1/2	7.12s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.010 प्रतिसाद वेळ (सरासरी) 7.12s
#191	Grok 4.1 Fast medium	X AI	10.0	4.7	$0.069	2/2	6.63s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.069 प्रतिसाद वेळ (सरासरी) 6.63s
#4	Gemini 3.5 Flash high	Google	10.0	9.5	$1.976	2/2	6.43s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.976 प्रतिसाद वेळ (सरासरी) 6.43s
#107	MiMo-V2.5 medium	Xiaomi	2.7	6.5	$0.082	0/2	6.33s
एकूण चाचण्या 2 चुकीच्या चाचण्या 2 एकूण खर्च $0.082 प्रतिसाद वेळ (सरासरी) 6.33s
#25	Grok 4.5 medium	X AI	10.0	8.3	$1.928	2/2	6.29s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.928 प्रतिसाद वेळ (सरासरी) 6.29s
#53	GLM 5 Turbo medium	Z.ai	10.0	7.6	$0.323	2/2	6.19s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.323 प्रतिसाद वेळ (सरासरी) 6.19s
#159	Hy3 preview low	Tencent	6.5	5.5	$0.015	1/2	5.85s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.015 प्रतिसाद वेळ (सरासरी) 5.85s
#35	GLM 5.2 high	Z.ai	10.0	8.0	$0.817	2/2	5.81s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.817 प्रतिसाद वेळ (सरासरी) 5.81s
#147	GLM 5 none	Z.ai	10.0	5.7	$0.041	2/2	5.78s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.041 प्रतिसाद वेळ (सरासरी) 5.78s
#55	Nemotron 3 Ultra medium	NVIDIA	10.0	7.5	$0.774	2/2	5.68s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.774 प्रतिसाद वेळ (सरासरी) 5.68s
#187	Grok 4.20 Multi Agent Beta medium	X AI	10.0	4.8	$5.599	2/2	5.54s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $5.599 प्रतिसाद वेळ (सरासरी) 5.54s
#3	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.742	2/2	5.43s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.742 प्रतिसाद वेळ (सरासरी) 5.43s
#21	GPT-5.4 medium	OpenAI	10.0	8.5	$1.533	2/2	5.32s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.533 प्रतिसाद वेळ (सरासरी) 5.32s
#106	Hy3 preview medium	Tencent	6.5	6.5	$0.018	1/2	5.25s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.018 प्रतिसाद वेळ (सरासरी) 5.25s

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स