डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

DeepSeek V4 Flash 10.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

216/216

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#81	Kimi K2.5 medium	Moonshot AI	10.0	7.0	$0.600	2/2	49.8s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.600 प्रतिसाद वेळ (सरासरी) 49.8s
#84	Seed-2.0-Mini medium	Bytedance Seed	10.0	7.0	$0.101	2/2	24.3s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.101 प्रतिसाद वेळ (सरासरी) 24.3s
#86	DeepSeek V4 Pro none	DeepSeek	10.0	6.9	$0.096	2/2	4.61s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.096 प्रतिसाद वेळ (सरासरी) 4.61s
#87	GPT-5.6 Sol none	OpenAI	10.0	6.9	$0.524	2/2	1.53s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.524 प्रतिसाद वेळ (सरासरी) 1.53s
#89	Qwen3.6 Flash medium	Qwen	10.0	6.9	$0.738	2/2	9.65s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.738 प्रतिसाद वेळ (सरासरी) 9.65s
#90	Step 3.7 Flash high	Stepfun	10.0	6.9	$1.207	2/2	14.7s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.207 प्रतिसाद वेळ (सरासरी) 14.7s
#91	GPT-5.5 none	OpenAI	10.0	6.9	$0.544	2/2	1.18s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.544 प्रतिसाद वेळ (सरासरी) 1.18s
#92	Gemini 3.5 Flash minimal	Google	10.0	6.8	$0.300	2/2	1.66s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.300 प्रतिसाद वेळ (सरासरी) 1.66s
#93	Gemini 3 Flash Preview none	Google	10.0	6.8	$0.085	2/2	1.41s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.085 प्रतिसाद वेळ (सरासरी) 1.41s
#94	Qwen3.6 35B A3B medium	Qwen	10.0	6.7	$0.746	2/2	13.0s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.746 प्रतिसाद वेळ (सरासरी) 13.0s
#95	Gemini 3.5 Flash-Lite low	Google	10.0	6.7	$0.145	2/2	657ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.145 प्रतिसाद वेळ (सरासरी) 657ms
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	10.0	6.7	$0.476	2/2	5.07s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.476 प्रतिसाद वेळ (सरासरी) 5.07s
#98	GLM 5V Turbo medium	Z.ai	10.0	6.7	$0.457	2/2	9.60s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.457 प्रतिसाद वेळ (सरासरी) 9.60s
#99	Claude Opus 4.7 none	Anthropic	10.0	6.6	$0.505	2/2	2.15s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.505 प्रतिसाद वेळ (सरासरी) 2.15s
#100	Gemma 4 26B A4B medium	Google	10.0	6.6	$0.089	2/2	16.5s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.089 प्रतिसाद वेळ (सरासरी) 16.5s

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स