डेटा पार्सिंग आणि निष्कर्षण मॉडेल क्रमवारी

डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↓.

दाखवलेली मॉडेल्स

सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर

8.9

सर्वोत्तम मॉडेल

Gemini 3.6 Flash 10.0

अयशस्वी होण्याची कारणे

अयशस्वी होण्याचे कारण चुकीचे उत्तर सह41 अयशस्वी होण्याचे कारण API त्रुटी सह14 अयशस्वी होण्याचे कारण उत्तर नाही सह8 अयशस्वी होण्याचे कारण अतिरिक्त फॉरमॅटिंग सह6 अयशस्वी होण्याचे कारण वेळ संपला सह1

216/216

क्रमांक	मॉडेल	कंपनी	डेटा पार्सिंग आणि निष्कर्षण स्कोअर	स्कोअर	एकूण खर्च	बरोबर चाचण्या	प्रतिसाद वेळ (सरासरी)
#66	KAT-Coder-Pro V2.5 low	Kwaipilot	10.0	7.4	$0.387	2/2	4.19s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.387 प्रतिसाद वेळ (सरासरी) 4.19s
#67	Claude Sonnet 4.6 none	Anthropic	10.0	7.3	$0.661	2/2	3.43s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.661 प्रतिसाद वेळ (सरासरी) 3.43s
#68	Gemini 3.1 Flash Lite Preview medium	Google	10.0	7.3	$0.115	2/2	2.29s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.115 प्रतिसाद वेळ (सरासरी) 2.29s
#69	Gemini 3.1 Flash Lite medium	Google	10.0	7.3	$0.117	2/2	2.60s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.117 प्रतिसाद वेळ (सरासरी) 2.60s
#72	Kimi K2.6 medium	Moonshot AI	10.0	7.2	$1.036	2/2	20.4s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.036 प्रतिसाद वेळ (सरासरी) 20.4s
#73	KAT-Coder-Pro V2.5 high	Kwaipilot	10.0	7.2	$0.482	2/2	4.13s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.482 प्रतिसाद वेळ (सरासरी) 4.13s
#74	Qwen3.5 Plus 2026-04-20 medium	Qwen	10.0	7.2	$0.317	2/2	38.3s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.317 प्रतिसाद वेळ (सरासरी) 38.3s
#75	Qwen3.7 Plus none	Qwen	10.0	7.2	$0.106	2/2	1.43s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.106 प्रतिसाद वेळ (सरासरी) 1.43s
#76	Qwen3.5-122B-A10B medium	Qwen	10.0	7.1	$1.046	2/2	23.4s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $1.046 प्रतिसाद वेळ (सरासरी) 23.4s
#77	Grok 4.3 medium	X AI	10.0	7.1	$0.779	2/2	19.0s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.779 प्रतिसाद वेळ (सरासरी) 19.0s
#78	GLM 5.1 medium	Z.ai	10.0	7.1	$0.535	2/2	9.33s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.535 प्रतिसाद वेळ (सरासरी) 9.33s
#79	Grok 4.20 medium	X AI	10.0	7.1	$0.777	2/2	4.17s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.777 प्रतिसाद वेळ (सरासरी) 4.17s
#80	DeepSeek V3.2 medium	DeepSeek	10.0	7.0	$0.078	2/2	36.1s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.078 प्रतिसाद वेळ (सरासरी) 36.1s
#81	Kimi K2.5 medium	Moonshot AI	10.0	7.0	$0.600	2/2	49.8s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.600 प्रतिसाद वेळ (सरासरी) 49.8s
#84	Seed-2.0-Mini medium	Bytedance Seed	10.0	7.0	$0.101	2/2	24.3s
एकूण चाचण्या 2 चुकीच्या चाचण्या 0 एकूण खर्च $0.101 प्रतिसाद वेळ (सरासरी) 24.3s

डेटा पार्सिंग आणि निष्कर्षण क्रमवारी

मॉडेल फिल्टर करा

डेटा पार्सिंग आणि निष्कर्षण स्कोअर नुसार शीर्ष मॉडेल्स

डेटा पार्सिंग आणि निष्कर्षण स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स