डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↑.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

MiMo-V2-Flash 6.5

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

216/216

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#122	Seed-2.0-Lite none	Bytedance Seed	10.0	6.2	$0.066	2/2	1.82s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.066 प्रतिसाद वेळ (सरासरी) 1.82s
#5	GPT-5.6 Sol low	OpenAI	10.0	9.5	$0.971	2/2	1.82s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.971 प्रतिसाद वेळ (सरासरी) 1.82s
#113	Qwen3.5 Plus 2026-02-15 none	Qwen	10.0	6.4	$0.073	2/2	1.89s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.073 प्रतिसाद वेळ (सरासरी) 1.89s
#135	Nemotron 3 Ultra none	NVIDIA	10.0	6.1	$0.095	2/2	1.94s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.095 प्रतिसाद वेळ (सरासरी) 1.94s
#54	GPT-5.6 Luna medium	OpenAI	10.0	7.6	$0.352	2/2	1.95s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.352 प्रतिसाद वेळ (सरासरी) 1.95s
#127	gpt-oss-120b medium	OpenAI	6.4	6.1	$0.019	1/2	1.98s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.019 प्रतिसाद वेळ (सरासरी) 1.98s
#158	Qwen3.6 27B none	Qwen	7.3	5.5	$0.087	1/2	2.06s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $0.087 प्रतिसाद वेळ (सरासरी) 2.06s
#129	Inkling low	Thinkingmachines	10.0	6.1	$0.187	2/2	2.07s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.187 प्रतिसाद वेळ (सरासरी) 2.07s
#130	Qwen3.6 Flash none	Qwen	10.0	6.1	$0.062	2/2	2.13s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.062 प्रतिसाद वेळ (सरासरी) 2.13s
#123	GPT-5.6 Luna low	OpenAI	10.0	6.2	$0.249	2/2	2.14s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.249 प्रतिसाद वेळ (सरासरी) 2.14s
#99	Claude Opus 4.7 none	Anthropic	10.0	6.6	$0.505	2/2	2.15s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.505 प्रतिसाद वेळ (सरासरी) 2.15s
#48	GPT-5.6 Luna high	OpenAI	10.0	7.7	$1.017	2/2	2.18s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.017 प्रतिसाद वेळ (सरासरी) 2.18s
#58	GPT-5.3 Chat none	OpenAI	10.0	7.5	$0.571	2/2	2.21s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.571 प्रतिसाद वेळ (सरासरी) 2.21s
#121	Gemma 4 31B none	Google	10.0	6.2	$0.021	2/2	2.25s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.021 प्रतिसाद वेळ (सरासरी) 2.25s
#45	Claude Opus 4.8 low	Anthropic	6.3	7.8	$2.077	1/2	2.27s
एकूण चाचण्या 2 चुकीच्या चाचण्या 1 एकूण खर्च $2.077 प्रतिसाद वेळ (सरासरी) 2.27s

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स