डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↓.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

Qwen3.5-9B 3.6

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

216/216

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#2	Gemini 3.6 Flash high	Google	10.0	9.7	$1.785	2/2	5.20s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.785 प्रतिसाद वेळ (सरासरी) 5.20s
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	10.0	6.7	$0.476	2/2	5.07s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.476 प्रतिसाद वेळ (सरासरी) 5.07s
#19	Muse Spark 1.1 medium	Meta	10.0	8.6	$1.357	2/2	4.96s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.357 प्रतिसाद वेळ (सरासरी) 4.96s
#192	Laguna M.1 medium	Poolside	10.0	4.7	$0.033	2/2	4.93s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.033 प्रतिसाद वेळ (सरासरी) 4.93s
#182	GLM 4.7 Flash none	Z.ai	7.3	4.9	$0.016	1/2	4.82s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.016 प्रतिसाद वेळ (सरासरी) 4.82s
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	7.3	6.9	$0.467	1/2	4.70s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.467 प्रतिसाद वेळ (सरासरी) 4.70s
#86	DeepSeek V4 Pro none	DeepSeek	10.0	6.9	$0.096	2/2	4.61s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.096 प्रतिसाद वेळ (सरासरी) 4.61s
#108	Laguna XS 2.1 medium	Poolside	10.0	6.5	$0.068	2/2	4.50s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.068 प्रतिसाद वेळ (सरासरी) 4.50s
#149	Gemini 3.1 Flash Lite high	Google	10.0	5.6	$2.044	2/2	4.49s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $2.044 प्रतिसाद वेळ (सरासरी) 4.49s
#1	Gemini 3.6 Flash medium	Google	10.0	9.9	$0.831	2/2	4.26s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.831 प्रतिसाद वेळ (सरासरी) 4.26s
#66	KAT-Coder-Pro V2.5 low	Kwaipilot	10.0	7.4	$0.387	2/2	4.19s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.387 प्रतिसाद वेळ (सरासरी) 4.19s
#13	GPT-5.5 medium	OpenAI	10.0	9.0	$4.137	2/2	4.18s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $4.137 प्रतिसाद वेळ (सरासरी) 4.18s
#79	Grok 4.20 medium	X AI	10.0	7.1	$0.777	2/2	4.17s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.777 प्रतिसाद वेळ (सरासरी) 4.17s
#73	KAT-Coder-Pro V2.5 high	Kwaipilot	10.0	7.2	$0.482	2/2	4.13s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.482 प्रतिसाद वेळ (सरासरी) 4.13s
#12	Gemini 3.5 Flash medium	Google	10.0	9.1	$0.642	2/2	4.07s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.642 प्रतिसाद वेळ (सरासरी) 4.07s

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स