डेटा पार्सिंग और निष्कर्षण मॉडल रैंकिंग

देखें कि डेटा पार्सिंग और निष्कर्षण में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।

दिखाए गए मॉडल

औसत डेटा पार्सिंग और निष्कर्षण स्कोर

8.9

सर्वश्रेष्ठ मॉडल

DeepSeek V4 Flash 10.0

विफलता के कारण

विफलता कारण गलत उत्तर के साथ41 विफलता कारण API त्रुटि के साथ14 विफलता कारण कोई उत्तर नहीं के साथ8 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ6 विफलता कारण समय समाप्त के साथ1

216/216

रैंक	मॉडल	कंपनी	डेटा पार्सिंग और निष्कर्षण स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#124	Gemini 2.5 Flash none	Google	10.0	6.2	$0.017	2/2	652ms
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.017 प्रतिक्रिया समय (औसत) 652ms
#126	Gemini 3.1 Flash Lite minimal	Google	10.0	6.1	$0.047	2/2	1.04s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.047 प्रतिक्रिया समय (औसत) 1.04s
#128	Gemini 3.1 Flash Lite none	Google	10.0	6.1	$0.046	2/2	843ms
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.046 प्रतिक्रिया समय (औसत) 843ms
#129	Inkling low	Thinkingmachines	10.0	6.1	$0.187	2/2	2.07s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.187 प्रतिक्रिया समय (औसत) 2.07s
#130	Qwen3.6 Flash none	Qwen	10.0	6.1	$0.062	2/2	2.13s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.062 प्रतिक्रिया समय (औसत) 2.13s
#131	Qwen3.5-Flash none	Qwen	10.0	6.1	$0.073	2/2	1.57s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.073 प्रतिक्रिया समय (औसत) 1.57s
#132	Qwen3.5 Plus 2026-04-20 none	Qwen	10.0	6.1	$0.122	2/2	2.82s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.122 प्रतिक्रिया समय (औसत) 2.82s
#133	Qwen3.5-35B-A3B none	Qwen	10.0	6.1	$0.106	2/2	1.16s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.106 प्रतिक्रिया समय (औसत) 1.16s
#135	Nemotron 3 Ultra none	NVIDIA	10.0	6.1	$0.095	2/2	1.94s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.095 प्रतिक्रिया समय (औसत) 1.94s
#137	Grok 4.20 Beta medium	X AI	10.0	6.0	$0.750	2/2	4.01s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.750 प्रतिक्रिया समय (औसत) 4.01s
#138	GPT-5.6 Terra none	OpenAI	10.0	6.0	$0.349	2/2	1.13s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.349 प्रतिक्रिया समय (औसत) 1.13s
#139	Gemini 3 PRO Preview medium	Google	10.0	6.0	$0.385	2/2	10.8s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.385 प्रतिक्रिया समय (औसत) 10.8s
#140	Mimo V2 Omni medium	Xiaomi	10.0	5.9	$0.683	2/2	3.04s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.683 प्रतिक्रिया समय (औसत) 3.04s
#142	GPT-5.4 Mini none	OpenAI	10.0	5.9	$0.095	2/2	1.30s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.095 प्रतिक्रिया समय (औसत) 1.30s
#143	North Mini Code medium	Cohere	10.0	5.9	$0.000	2/2	24.1s
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 24.1s

डेटा पार्सिंग और निष्कर्षण रैंकिंग

मॉडल फ़िल्टर करें

डेटा पार्सिंग और निष्कर्षण स्कोर के अनुसार शीर्ष मॉडल

डेटा पार्सिंग और निष्कर्षण स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल