डेटा पार्सिंग और निष्कर्षण मॉडल रैंकिंग

देखें कि डेटा पार्सिंग और निष्कर्षण में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.

दिखाए गए मॉडल

औसत डेटा पार्सिंग और निष्कर्षण स्कोर

8.9

सर्वश्रेष्ठ मॉडल

Qwen3.5-9B 3.6

विफलता के कारण

विफलता कारण गलत उत्तर के साथ41 विफलता कारण API त्रुटि के साथ14 विफलता कारण कोई उत्तर नहीं के साथ8 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ6 विफलता कारण समय समाप्त के साथ1

216/216

रैंक	मॉडल	कंपनी	डेटा पार्सिंग और निष्कर्षण स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#2	Gemini 3.6 Flash high	Google	10.0	9.7	$1.785	2/2	5.20s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $1.785 प्रतिक्रिया समय (औसत) 5.20s
#97	KAT-Coder-Pro V2.5 none	Kwaipilot	10.0	6.7	$0.476	2/2	5.07s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.476 प्रतिक्रिया समय (औसत) 5.07s
#19	Muse Spark 1.1 medium	Meta	10.0	8.6	$1.357	2/2	4.96s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $1.357 प्रतिक्रिया समय (औसत) 4.96s
#192	Laguna M.1 medium	Poolside	10.0	4.7	$0.033	2/2	4.93s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.033 प्रतिक्रिया समय (औसत) 4.93s
#182	GLM 4.7 Flash none	Z.ai	7.3	4.9	$0.016	1/2	4.82s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.016 प्रतिक्रिया समय (औसत) 4.82s
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	7.3	6.9	$0.467	1/2	4.70s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.467 प्रतिक्रिया समय (औसत) 4.70s
#86	DeepSeek V4 Pro none	DeepSeek	10.0	6.9	$0.096	2/2	4.61s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.096 प्रतिक्रिया समय (औसत) 4.61s
#108	Laguna XS 2.1 medium	Poolside	10.0	6.5	$0.068	2/2	4.50s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.068 प्रतिक्रिया समय (औसत) 4.50s
#149	Gemini 3.1 Flash Lite high	Google	10.0	5.6	$2.044	2/2	4.49s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $2.044 प्रतिक्रिया समय (औसत) 4.49s
#1	Gemini 3.6 Flash medium	Google	10.0	9.9	$0.831	2/2	4.26s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.831 प्रतिक्रिया समय (औसत) 4.26s
#66	KAT-Coder-Pro V2.5 low	Kwaipilot	10.0	7.4	$0.387	2/2	4.19s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.387 प्रतिक्रिया समय (औसत) 4.19s
#13	GPT-5.5 medium	OpenAI	10.0	9.0	$4.137	2/2	4.18s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $4.137 प्रतिक्रिया समय (औसत) 4.18s
#79	Grok 4.20 medium	X AI	10.0	7.1	$0.777	2/2	4.17s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.777 प्रतिक्रिया समय (औसत) 4.17s
#73	KAT-Coder-Pro V2.5 high	Kwaipilot	10.0	7.2	$0.482	2/2	4.13s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.482 प्रतिक्रिया समय (औसत) 4.13s
#12	Gemini 3.5 Flash medium	Google	10.0	9.1	$0.642	2/2	4.07s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.642 प्रतिक्रिया समय (औसत) 4.07s

डेटा पार्सिंग और निष्कर्षण रैंकिंग

मॉडल फ़िल्टर करें

डेटा पार्सिंग और निष्कर्षण स्कोर के अनुसार शीर्ष मॉडल

डेटा पार्सिंग और निष्कर्षण स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल