AI BENCHY श्रेणी
डेटा पार्सिंग और निष्कर्षण रैंकिंग
देखें कि डेटा पार्सिंग और निष्कर्षण में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↓.
दिखाए गए मॉडल
15
औसत डेटा पार्सिंग और निष्कर्षण स्कोर
9.0
सर्वश्रेष्ठ मॉडल
Gemini 3 Flash Preview 10.0| रैंक | मॉडल | कंपनी | डेटा पार्सिंग और निष्कर्षण स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #70 | Qwen3.5-122B-A10B none | Qwen | 10.0 | 5.7 | 2/2 | 1.01s |
| #72 | Hunter Alpha none | OpenRouter | 10.0 | 5.7 | 2/2 | 8.49s |
| #75 | GLM 5.1 none | Z.ai | 10.0 | 5.6 | 2/2 | 1.08s |
| #77 | GLM 5 Turbo none | Z.ai | 10.0 | 5.5 | 2/2 | 2.47s |
| #78 | Trinity Large Preview none | Arcee AI | 10.0 | 5.3 | 2/2 | 3.26s |
| #79 | Grok 4.20 Beta none | X AI | 10.0 | 5.3 | 2/2 | 601ms |
| #82 | Grok 4.20 none | X AI | 10.0 | 5.2 | 2/2 | 522ms |
| #83 | Mistral Small 4 none | Mistral | 10.0 | 5.2 | 2/2 | 822ms |
| #86 | GPT-5.4 Mini none | OpenAI | 10.0 | 5.1 | 2/2 | 1.30s |
| #88 | Nemotron 3 Super none | NVIDIA | 10.0 | 5.1 | 2/2 | 7.92s |
| #89 | GPT-4o-mini none | OpenAI | 10.0 | 4.9 | 2/2 | 1.27s |
| #90 | Qwen3.5-9B none | Qwen | 10.0 | 4.8 | 2/2 | 847ms |
| #95 | Grok 4.1 Fast none | X AI | 10.0 | 4.5 | 2/2 | 943ms |
| #13 | GLM 5 medium | Z.ai | 7.1 | 8.4 | 1/2 | 8.90s |
| #23 | MiMo-V2-Pro medium | Xiaomi | 7.3 | 8.1 | 1/2 | 17.2s |