AI BENCHY श्रेणी
डेटा पार्सिंग और निष्कर्षण रैंकिंग
देखें कि डेटा पार्सिंग और निष्कर्षण में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.
| रैंक | मॉडल | कंपनी | डेटा पार्सिंग और निष्कर्षण स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #90 | Qwen3.5-9B none | Qwen | 10.0 | 4.8 | 2/2 | 847ms |
| #83 | Mistral Small 4 none | Mistral | 10.0 | 5.2 | 2/2 | 822ms |
| #98 | LFM2-24B-A2B none | Liquid | 3.0 | 4.1 | 0/2 | 714ms |
| #91 | Mercury 2 none | Inception | 7.3 | 4.8 | 1/2 | 667ms |
| #62 | Gemini 2.5 Flash none | 10.0 | 6.2 | 2/2 | 652ms | |
| #79 | Grok 4.20 Beta none | X AI | 10.0 | 5.3 | 2/2 | 601ms |
| #82 | Grok 4.20 none | X AI | 10.0 | 5.2 | 2/2 | 522ms |
| #41 | MiMo-V2-Flash medium | Xiaomi | 6.5 | 7.5 | 1/2 | 0ms |