डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

DeepSeek V4 Flash 10.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

210/210

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#48	Grok Build 0.1 medium	X AI	10.0	7.6	$1.097	2/2	10.7s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.097 प्रतिसाद वेळ (सरासरी) 10.7s
#49	GLM 5 Turbo medium	Z.ai	10.0	7.6	$0.323	2/2	6.19s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.323 प्रतिसाद वेळ (सरासरी) 6.19s
#50	GPT-5.6 Luna medium	OpenAI	10.0	7.6	$0.352	2/2	1.95s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.352 प्रतिसाद वेळ (सरासरी) 1.95s
#51	Nemotron 3 Ultra medium	NVIDIA	10.0	7.5	$0.774	2/2	5.68s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.774 प्रतिसाद वेळ (सरासरी) 5.68s
#52	Kimi K2.7 Code medium	Moonshot AI	10.0	7.5	$0.751	2/2	12.3s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.751 प्रतिसाद वेळ (सरासरी) 12.3s
#53	GPT-5.4 Nano medium	OpenAI	10.0	7.5	$0.138	2/2	2.54s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.138 प्रतिसाद वेळ (सरासरी) 2.54s
#54	GPT-5.3 Chat none	OpenAI	10.0	7.5	$0.571	2/2	2.21s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.571 प्रतिसाद वेळ (सरासरी) 2.21s
#55	GPT-5.6 Terra low	OpenAI	10.0	7.5	$0.519	2/2	919ms
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.519 प्रतिसाद वेळ (सरासरी) 919ms
#56	GPT-5.4 Mini medium	OpenAI	10.0	7.5	$0.756	2/2	2.43s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.756 प्रतिसाद वेळ (सरासरी) 2.43s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	10.0	7.5	$0.437	2/2	46.9s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.437 प्रतिसाद वेळ (सरासरी) 46.9s
#58	Qwen3.5-27B medium	Qwen	10.0	7.4	$1.627	2/2	30.3s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.627 प्रतिसाद वेळ (सरासरी) 30.3s
#59	Qwen3.7 Max none	Qwen	10.0	7.4	$0.197	2/2	1.35s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.197 प्रतिसाद वेळ (सरासरी) 1.35s
#61	Gemini 3 Flash Preview low	Google	10.0	7.4	$0.177	2/2	9.40s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.177 प्रतिसाद वेळ (सरासरी) 9.40s
#62	KAT-Coder-Pro V2.5 low	Kwaipilot	10.0	7.4	$0.387	2/2	4.19s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.387 प्रतिसाद वेळ (सरासरी) 4.19s
#63	Claude Sonnet 4.6 none	Anthropic	10.0	7.3	$0.661	2/2	3.43s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.661 प्रतिसाद वेळ (सरासरी) 3.43s

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स