डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↓.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

Gemini 3.6 Flash 10.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

216/216

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#86	DeepSeek V4 Pro none	DeepSeek	10.0	6.9	$0.096	2/2	4.61s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.096 प्रतिसाद वेळ (सरासरी) 4.61s
#87	GPT-5.6 Sol none	OpenAI	10.0	6.9	$0.524	2/2	1.53s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.524 प्रतिसाद वेळ (सरासरी) 1.53s
#89	Qwen3.6 Flash medium	Qwen	10.0	6.9	$0.738	2/2	9.65s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.738 प्रतिसाद वेळ (सरासरी) 9.65s
#90	Step 3.7 Flash high	Stepfun	10.0	6.9	$1.207	2/2	14.7s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.207 प्रतिसाद वेळ (सरासरी) 14.7s
#91	GPT-5.5 none	OpenAI	10.0	6.9	$0.544	2/2	1.18s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.544 प्रतिसाद वेळ (सरासरी) 1.18s
#92	Gemini 3.5 Flash minimal	Google	10.0	6.8	$0.300	2/2	1.66s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.300 प्रतिसाद वेळ (सरासरी) 1.66s
#93	Gemini 3 Flash Preview none	Google	10.0	6.8	$0.085	2/2	1.41s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.085 प्रतिसाद वेळ (सरासरी) 1.41s
#94	Qwen3.6 35B A3B medium	Qwen	10.0	6.7	$0.746	2/2	13.0s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.746 प्रतिसाद वेळ (सरासरी) 13.0s
#95	Gemini 3.5 Flash-Lite low	Google	10.0	6.7	$0.145	2/2	657ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.145 प्रतिसाद वेळ (सरासरी) 657ms
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	10.0	6.7	$0.476	2/2	5.07s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.476 प्रतिसाद वेळ (सरासरी) 5.07s
#98	GLM 5V Turbo medium	Z.ai	10.0	6.7	$0.457	2/2	9.60s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.457 प्रतिसाद वेळ (सरासरी) 9.60s
#99	Claude Opus 4.7 none	Anthropic	10.0	6.6	$0.505	2/2	2.15s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.505 प्रतिसाद वेळ (सरासरी) 2.15s
#100	Gemma 4 26B A4B medium	Google	10.0	6.6	$0.089	2/2	16.5s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.089 प्रतिसाद वेळ (सरासरी) 16.5s
#101	GLM 5.2 none	Z.ai	10.0	6.6	$0.128	2/2	7.17s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.128 प्रतिसाद वेळ (सरासरी) 7.17s
#103	Qwen3.6 Max Preview none	Qwen	10.0	6.6	$0.231	2/2	2.87s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.231 प्रतिसाद वेळ (सरासरी) 2.87s

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स