डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↓.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

Gemini 3.6 Flash 10.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

216/216

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#128	Gemini 3.1 Flash Lite none	Google	10.0	6.1	$0.046	2/2	843ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.046 प्रतिसाद वेळ (सरासरी) 843ms
#129	Inkling low	Thinkingmachines	10.0	6.1	$0.187	2/2	2.07s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.187 प्रतिसाद वेळ (सरासरी) 2.07s
#130	Qwen3.6 Flash none	Qwen	10.0	6.1	$0.062	2/2	2.13s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.062 प्रतिसाद वेळ (सरासरी) 2.13s
#131	Qwen3.5-Flash none	Qwen	10.0	6.1	$0.073	2/2	1.57s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.073 प्रतिसाद वेळ (सरासरी) 1.57s
#132	Qwen3.5 Plus 2026-04-20 none	Qwen	10.0	6.1	$0.122	2/2	2.82s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.122 प्रतिसाद वेळ (सरासरी) 2.82s
#133	Qwen3.5-35B-A3B none	Qwen	10.0	6.1	$0.106	2/2	1.16s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.106 प्रतिसाद वेळ (सरासरी) 1.16s
#135	Nemotron 3 Ultra none	NVIDIA	10.0	6.1	$0.095	2/2	1.94s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.095 प्रतिसाद वेळ (सरासरी) 1.94s
#136	Step 3.5 Flash medium	Stepfun	10.0	6.0	$0.108	2/2	15.0s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.108 प्रतिसाद वेळ (सरासरी) 15.0s
#137	Grok 4.20 Beta medium	X AI	10.0	6.0	$0.750	2/2	4.01s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.750 प्रतिसाद वेळ (सरासरी) 4.01s
#138	GPT-5.6 Terra none	OpenAI	10.0	6.0	$0.349	2/2	1.13s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.349 प्रतिसाद वेळ (सरासरी) 1.13s
#139	Gemini 3 PRO Preview medium	Google	10.0	6.0	$0.385	2/2	10.8s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.385 प्रतिसाद वेळ (सरासरी) 10.8s
#140	Mimo V2 Omni medium	Xiaomi	10.0	5.9	$0.683	2/2	3.04s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.683 प्रतिसाद वेळ (सरासरी) 3.04s
#142	GPT-5.4 Mini none	OpenAI	10.0	5.9	$0.095	2/2	1.30s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.095 प्रतिसाद वेळ (सरासरी) 1.30s
#143	North Mini Code medium	Cohere	10.0	5.9	$0.000	2/2	24.1s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.000 प्रतिसाद वेळ (सरासरी) 24.1s
#144	Kimi K2.6 none	Moonshot AI	10.0	5.8	$0.184	2/2	1.32s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.184 प्रतिसाद वेळ (सरासरी) 1.32s

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स