डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↑.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

LongCat 2.0 3.6

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

216/216

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#3	Gemini 3 Flash Preview medium	Google	10.0	9.6	$0.742	2/2	5.43s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.742 प्रतिसाद वेळ (सरासरी) 5.43s
#4	Gemini 3.5 Flash high	Google	10.0	9.5	$1.976	2/2	6.43s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.976 प्रतिसाद वेळ (सरासरी) 6.43s
#5	GPT-5.6 Sol low	OpenAI	10.0	9.5	$0.971	2/2	1.82s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.971 प्रतिसाद वेळ (सरासरी) 1.82s
#6	Gemini 3.6 Flash low	Google	10.0	9.4	$0.517	2/2	1.48s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.517 प्रतिसाद वेळ (सरासरी) 1.48s
#7	GPT-5.6 Sol medium	OpenAI	10.0	9.4	$1.316	2/2	1.38s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.316 प्रतिसाद वेळ (सरासरी) 1.38s
#8	GPT-5.6 Sol high	OpenAI	10.0	9.4	$1.234	2/2	1.16s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.234 प्रतिसाद वेळ (सरासरी) 1.16s
#9	GPT-5.5 low	OpenAI	10.0	9.3	$1.253	2/2	3.28s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.253 प्रतिसाद वेळ (सरासरी) 3.28s
#10	Gemini 3.1 Pro Preview medium	Google	10.0	9.2	$1.361	2/2	7.72s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.361 प्रतिसाद वेळ (सरासरी) 7.72s
#11	Qwen3.7 Max medium	Qwen	10.0	9.2	$1.116	2/2	8.80s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.116 प्रतिसाद वेळ (सरासरी) 8.80s
#12	Gemini 3.5 Flash medium	Google	10.0	9.1	$0.642	2/2	4.07s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.642 प्रतिसाद वेळ (सरासरी) 4.07s
#13	GPT-5.5 medium	OpenAI	10.0	9.0	$4.137	2/2	4.18s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $4.137 प्रतिसाद वेळ (सरासरी) 4.18s
#14	Gemini 3.5 Flash low	Google	10.0	8.9	$0.433	2/2	1.81s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.433 प्रतिसाद वेळ (सरासरी) 1.81s
#15	Grok 4.5 high	X AI	10.0	8.9	$1.707	2/2	7.63s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.707 प्रतिसाद वेळ (सरासरी) 7.63s
#16	GPT-5.3-Codex medium	OpenAI	10.0	8.9	$0.920	2/2	3.07s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.920 प्रतिसाद वेळ (सरासरी) 3.07s
#18	Claude Opus 4.7 medium	Anthropic	10.0	8.7	$1.477	2/2	2.37s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.477 प्रतिसाद वेळ (सरासरी) 2.37s

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स