डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: मेट्रिक ↑.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

Step 3.5 Flash 1.5

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

210/210

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#193	Elephant Alpha none	Openrouter	6.5	4.3	$0.000	1/2	1.04s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 1.04s
#195	Elephant Alpha medium	Openrouter	6.5	4.3	$0.000	1/2	979ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 979ms
#79	Gemini 3.5 Flash none	Google	6.5	7.0	$1.079	1/2	8.10s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $1.079 प्रतिसाद वेळ (सरासरी) 8.10s
#100	Hy3 preview medium	Tencent	6.5	6.5	$0.018	1/2	5.25s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.018 प्रतिसाद वेळ (सरासरी) 5.25s
#113	MiMo-V2-Flash medium	Xiaomi	6.5	6.3	$0.043	1/2	0ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.043 प्रतिसाद वेळ (सरासरी) 0ms
#135	Hy3 preview high	Tencent	6.5	5.9	$0.048	1/2	12.1s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.048 प्रतिसाद वेळ (सरासरी) 12.1s
#153	Hy3 preview low	Tencent	6.5	5.5	$0.015	1/2	5.85s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.015 प्रतिसाद वेळ (सरासरी) 5.85s
#168	MiMo-V2.5 none	Xiaomi	6.5	5.1	$0.025	1/2	1.01s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.025 प्रतिसाद वेळ (सरासरी) 1.01s
#199	Hy3 preview none	Tencent	6.5	4.0	$0.003	1/2	2.85s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.003 प्रतिसाद वेळ (सरासरी) 2.85s
#206	gpt-oss-120b none	OpenAI	6.5	3.7	$0.010	1/2	7.12s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.010 प्रतिसाद वेळ (सरासरी) 7.12s
#14	Claude Opus 4.8 medium	Anthropic	7.1	8.8	$1.931	1/2	12.3s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $1.931 प्रतिसाद वेळ (सरासरी) 12.3s
#42	GLM 5 medium	Z.ai	7.1	7.7	$0.307	1/2	8.90s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.307 प्रतिसाद वेळ (सरासरी) 8.90s
#198	Laguna Xs.2 medium	Poolside	7.1	4.1	$0.015	1/2	9.34s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.015 प्रतिसाद वेळ (सरासरी) 9.34s
#33	Kimi K3 max	Moonshot AI	7.3	8.0	$3.112	1/2	16.7s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $3.112 प्रतिसाद वेळ (सरासरी) 16.7s
#66	Claude Opus 4.8 none	Anthropic	7.3	7.3	$1.166	1/2	1.77s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $1.166 प्रतिसाद वेळ (सरासरी) 1.77s

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स