AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↓.
| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #90 | Qwen3.5-9B none | Qwen | 10.0 | 4.8 | 2/2 | 847ms |
| #83 | Mistral Small 4 none | Mistral | 10.0 | 5.2 | 2/2 | 822ms |
| #98 | LFM2-24B-A2B none | Liquid | 3.0 | 4.1 | 0/2 | 714ms |
| #91 | Mercury 2 none | Inception | 7.3 | 4.8 | 1/2 | 667ms |
| #62 | Gemini 2.5 Flash none | 10.0 | 6.2 | 2/2 | 652ms | |
| #79 | Grok 4.20 Beta none | X AI | 10.0 | 5.3 | 2/2 | 601ms |
| #82 | Grok 4.20 none | X AI | 10.0 | 5.2 | 2/2 | 522ms |
| #41 | MiMo-V2-Flash medium | Xiaomi | 6.5 | 7.5 | 1/2 | 0ms |