डेटा पार्सिंग और निष्कर्षण मॉडल रैंकिंग

देखें कि डेटा पार्सिंग और निष्कर्षण में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: मेट्रिक ↑.

दिखाए गए मॉडल

औसत डेटा पार्सिंग और निष्कर्षण स्कोर

8.9

सर्वश्रेष्ठ मॉडल

Step 3.5 Flash 1.5

विफलता के कारण

विफलता कारण गलत उत्तर के साथ41 विफलता कारण API त्रुटि के साथ14 विफलता कारण कोई उत्तर नहीं के साथ8 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ6 विफलता कारण समय समाप्त के साथ1

216/216

रैंक	मॉडल	कंपनी	डेटा पार्सिंग और निष्कर्षण स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#71	Step 3.7 Flash low	Stepfun	7.3	7.3	$0.454	1/2	2.29s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.454 प्रतिक्रिया समय (औसत) 2.29s
#88	MiMo-V2.5-Pro medium	Xiaomi	7.3	6.9	$0.187	1/2	18.8s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.187 प्रतिक्रिया समय (औसत) 18.8s
#115	Mimo V2 PRO medium	Xiaomi	7.3	6.3	$0.333	1/2	17.2s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.333 प्रतिक्रिया समय (औसत) 17.2s
#158	Qwen3.6 27B none	Qwen	7.3	5.5	$0.087	1/2	2.06s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.087 प्रतिक्रिया समय (औसत) 2.06s
#161	Kimi K2.5 none	Moonshot AI	7.3	5.5	$0.127	1/2	42.1s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.127 प्रतिक्रिया समय (औसत) 42.1s
#182	GLM 4.7 Flash none	Z.ai	7.3	4.9	$0.016	1/2	4.82s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.016 प्रतिक्रिया समय (औसत) 4.82s
#82	Mercury 2 medium	Inception	7.3	7.0	$0.093	1/2	1.11s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.093 प्रतिक्रिया समय (औसत) 1.11s
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	7.3	6.9	$0.467	1/2	4.70s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.467 प्रतिक्रिया समय (औसत) 4.70s
#120	Qwen3.5-Flash medium	Qwen	7.3	6.2	$0.139	1/2	57.0s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.139 प्रतिक्रिया समय (औसत) 57.0s
#125	Qwen3.5-35B-A3B medium	Qwen	7.3	6.2	$0.837	1/2	59.3s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.837 प्रतिक्रिया समय (औसत) 59.3s
#173	Mistral Small 4 medium	Mistral	7.3	5.1	$0.096	1/2	1.23s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.096 प्रतिक्रिया समय (औसत) 1.23s
#195	Mercury 2 none	Inception	7.3	4.6	$0.030	1/2	667ms
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.030 प्रतिक्रिया समय (औसत) 667ms
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	7.3	3.4	$0.000	1/2	2.72s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 2.72s
#1	Gemini 3.6 Flash medium	Google	10.0	9.9	$0.831	2/2	4.26s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.831 प्रतिक्रिया समय (औसत) 4.26s
#2	Gemini 3.6 Flash high	Google	10.0	9.7	$1.785	2/2	5.20s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $1.785 प्रतिक्रिया समय (औसत) 5.20s

डेटा पार्सिंग और निष्कर्षण रैंकिंग

मॉडल फ़िल्टर करें

डेटा पार्सिंग और निष्कर्षण स्कोर के अनुसार शीर्ष मॉडल

डेटा पार्सिंग और निष्कर्षण स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल