डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↑.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

LongCat 2.0 3.6

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

216/216

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#89	Qwen3.6 Flash medium	Qwen	10.0	6.9	$0.738	2/2	9.65s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.738 प्रतिसाद वेळ (सरासरी) 9.65s
#90	Step 3.7 Flash high	Stepfun	10.0	6.9	$1.207	2/2	14.7s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.207 प्रतिसाद वेळ (सरासरी) 14.7s
#91	GPT-5.5 none	OpenAI	10.0	6.9	$0.544	2/2	1.18s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.544 प्रतिसाद वेळ (सरासरी) 1.18s
#92	Gemini 3.5 Flash minimal	Google	10.0	6.8	$0.300	2/2	1.66s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.300 प्रतिसाद वेळ (सरासरी) 1.66s
#93	Gemini 3 Flash Preview none	Google	10.0	6.8	$0.085	2/2	1.41s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.085 प्रतिसाद वेळ (सरासरी) 1.41s
#94	Qwen3.6 35B A3B medium	Qwen	10.0	6.7	$0.746	2/2	13.0s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.746 प्रतिसाद वेळ (सरासरी) 13.0s
#95	Gemini 3.5 Flash-Lite low	Google	10.0	6.7	$0.145	2/2	657ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.145 प्रतिसाद वेळ (सरासरी) 657ms
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	10.0	6.7	$0.476	2/2	5.07s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.476 प्रतिसाद वेळ (सरासरी) 5.07s
#98	GLM 5V Turbo medium	Z.ai	10.0	6.7	$0.457	2/2	9.60s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.457 प्रतिसाद वेळ (सरासरी) 9.60s
#99	Claude Opus 4.7 none	Anthropic	10.0	6.6	$0.505	2/2	2.15s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.505 प्रतिसाद वेळ (सरासरी) 2.15s
#100	Gemma 4 26B A4B medium	Google	10.0	6.6	$0.089	2/2	16.5s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.089 प्रतिसाद वेळ (सरासरी) 16.5s
#101	GLM 5.2 none	Z.ai	10.0	6.6	$0.128	2/2	7.17s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.128 प्रतिसाद वेळ (सरासरी) 7.17s
#103	Qwen3.6 Max Preview none	Qwen	10.0	6.6	$0.231	2/2	2.87s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.231 प्रतिसाद वेळ (सरासरी) 2.87s
#104	Gemini 3.5 Flash-Lite medium	Google	10.0	6.5	$0.369	2/2	1.69s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.369 प्रतिसाद वेळ (सरासरी) 1.69s
#108	Laguna XS 2.1 medium	Poolside	10.0	6.5	$0.068	2/2	4.50s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.068 प्रतिसाद वेळ (सरासरी) 4.50s

←

1 9 10 11 15

→

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स