डेटा पार्सिंग और निष्कर्षण मॉडल रैंकिंग

देखें कि डेटा पार्सिंग और निष्कर्षण में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: मेट्रिक ↑.

दिखाए गए मॉडल

औसत डेटा पार्सिंग और निष्कर्षण स्कोर

8.9

सर्वश्रेष्ठ मॉडल

Step 3.5 Flash 1.5

विफलता के कारण

विफलता कारण गलत उत्तर के साथ41 विफलता कारण API त्रुटि के साथ14 विफलता कारण कोई उत्तर नहीं के साथ8 विफलता कारण अतिरिक्त फॉर्मेटिंग के साथ6 विफलता कारण समय समाप्त के साथ1

210/210

रैंक	मॉडल	कंपनी	डेटा पार्सिंग और निष्कर्षण स्कोर	स्कोर	कुल लागत	सही परीक्षण	प्रतिक्रिया समय (औसत)
#193	Elephant Alpha none	Openrouter	6.5	4.3	$0.000	1/2	1.04s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 1.04s
#195	Elephant Alpha medium	Openrouter	6.5	4.3	$0.000	1/2	979ms
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.000 प्रतिक्रिया समय (औसत) 979ms
#79	Gemini 3.5 Flash none	Google	6.5	7.0	$1.079	1/2	8.10s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $1.079 प्रतिक्रिया समय (औसत) 8.10s
#100	Hy3 preview medium	Tencent	6.5	6.5	$0.018	1/2	5.25s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.018 प्रतिक्रिया समय (औसत) 5.25s
#113	MiMo-V2-Flash medium	Xiaomi	6.5	6.3	$0.043	1/2	0ms
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.043 प्रतिक्रिया समय (औसत) 0ms
#135	Hy3 preview high	Tencent	6.5	5.9	$0.048	1/2	12.1s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.048 प्रतिक्रिया समय (औसत) 12.1s
#153	Hy3 preview low	Tencent	6.5	5.5	$0.015	1/2	5.85s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.015 प्रतिक्रिया समय (औसत) 5.85s
#168	MiMo-V2.5 none	Xiaomi	6.5	5.1	$0.025	1/2	1.01s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.025 प्रतिक्रिया समय (औसत) 1.01s
#199	Hy3 preview none	Tencent	6.5	4.0	$0.003	1/2	2.85s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.003 प्रतिक्रिया समय (औसत) 2.85s
#206	gpt-oss-120b none	OpenAI	6.5	3.7	$0.010	1/2	7.12s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.010 प्रतिक्रिया समय (औसत) 7.12s
#14	Claude Opus 4.8 medium	Anthropic	7.1	8.8	$1.931	1/2	12.3s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $1.931 प्रतिक्रिया समय (औसत) 12.3s
#42	GLM 5 medium	Z.ai	7.1	7.7	$0.307	1/2	8.90s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.307 प्रतिक्रिया समय (औसत) 8.90s
#198	Laguna Xs.2 medium	Poolside	7.1	4.1	$0.015	1/2	9.34s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $0.015 प्रतिक्रिया समय (औसत) 9.34s
#33	Kimi K3 max	Moonshot AI	7.3	8.0	$3.112	1/2	16.7s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $3.112 प्रतिक्रिया समय (औसत) 16.7s
#66	Claude Opus 4.8 none	Anthropic	7.3	7.3	$1.166	1/2	1.77s
कुल टेस्ट 2 गलत टेस्ट 1 कुल लागत $1.166 प्रतिक्रिया समय (औसत) 1.77s

डेटा पार्सिंग और निष्कर्षण रैंकिंग

मॉडल फ़िल्टर करें

डेटा पार्सिंग और निष्कर्षण स्कोर के अनुसार शीर्ष मॉडल

डेटा पार्सिंग और निष्कर्षण स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत) के अनुसार शीर्ष मॉडल