डेटा पार्सिंग और निष्कर्षण मॉडल रैंकिंग

देखें कि डेटा पार्सिंग और निष्कर्षण में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.

दिखाए गए मॉडल

औसत डेटा पार्सिंग और निष्कर्षण स्कोर

8.9

सर्वश्रेष्ठ मॉडल

MiMo-V2-Flash 6.5

विफलता के कारण

विफलता कारण गलत उत्तर के साथ41 विफलता कारण API त्रुटि के साथ14 विफलता कारण कोई उत्तर नहीं के साथ8 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ6 विफलता कारण समय समाप्त के साथ1

210/210

रैंक	मॉडल	कंपनी	डेटा पार्सिंग और निष्कर्षण स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#113	MiMo-V2-Flash medium	Xiaomi	6.5	6.3	$0.043	1/2	0ms
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.043 प्रतिक्रिया समय (औसत) 0ms
#209	Step 3.5 Flash none	Stepfun	1.5	2.3	$0.020	0/1	0ms
कुल टेस्ट 1 गलत टेस्ट 1 कुल लागत $0.020 प्रतिक्रिया समय (औसत) 0ms
#197	Grok 4.20 none	X AI	10.0	4.1	$0.057	2/2	522ms
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.057 प्रतिक्रिया समय (औसत) 522ms
#201	Granite 4.1 8B none	IBM Granite	3.0	4.0	$0.007	0/2	575ms
कुल टेस्ट 2 गलत टेस्ट 2 कुल लागत $0.007 प्रतिक्रिया समय (औसत) 575ms
#191	Grok 4.20 Beta none	X AI	10.0	4.4	$0.087	2/2	601ms
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.087 प्रतिक्रिया समय (औसत) 601ms
#205	Laguna Xs.2 none	Poolside	10.0	3.8	$0.004	2/2	646ms
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.004 प्रतिक्रिया समय (औसत) 646ms
#118	Gemini 2.5 Flash none	Google	10.0	6.2	$0.017	2/2	652ms
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.017 प्रतिक्रिया समय (औसत) 652ms
#189	Mercury 2 none	Inception	7.3	4.6	$0.030	1/2	667ms
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.030 प्रतिक्रिया समय (औसत) 667ms
#210	LFM2-24B-A2B none	Liquid	3.0	2.2	$0.001	0/2	714ms
कुल टेस्ट 2 गलत टेस्ट 2 कुल लागत $0.001 प्रतिक्रिया समय (औसत) 714ms
#159	GPT-5.6 Luna none	OpenAI	10.0	5.4	$0.142	2/2	758ms
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.142 प्रतिक्रिया समय (औसत) 758ms
#160	Laguna XS 2.1 none	Poolside	10.0	5.3	$0.008	2/2	768ms
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.008 प्रतिक्रिया समय (औसत) 768ms
#165	Mistral Small 4 none	Mistral	10.0	5.1	$0.022	2/2	822ms
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.022 प्रतिक्रिया समय (औसत) 822ms
#122	Gemini 3.1 Flash Lite none	Google	10.0	6.1	$0.046	2/2	843ms
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.046 प्रतिक्रिया समय (औसत) 843ms
#169	Qwen3.5-9B none	Qwen	10.0	5.1	$0.021	2/2	847ms
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.021 प्रतिक्रिया समय (औसत) 847ms
#39	GPT-5.6 Terra medium	OpenAI	10.0	7.8	$0.676	2/2	872ms
कुल टेस्ट 2 गलत टेस्ट 0 कुल लागत $0.676 प्रतिक्रिया समय (औसत) 872ms

1 2 14

→

डेटा पार्सिंग और निष्कर्षण रैंकिंग

मॉडल फ़िल्टर करें

डेटा पार्सिंग और निष्कर्षण स्कोर के अनुसार शीर्ष मॉडल

डेटा पार्सिंग और निष्कर्षण स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल