AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↓.
| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #33 | Hy3 preview medium | Tencent | 6.5 | 7.7 | 1/2 | 5.25s |
| #92 | Laguna M.1 medium | Poolside | 10.0 | 6.4 | 2/2 | 4.93s |
| #122 | GLM 4.7 Flash none | Z.ai | 7.3 | 5.5 | 1/2 | 4.82s |
| #53 | Gemini 3.1 Flash Lite high | 10.0 | 7.3 | 2/2 | 4.49s | |
| #9 | GPT-5.5 medium | OpenAI | 10.0 | 8.8 | 2/2 | 4.18s |
| #65 | Grok 4.20 medium | X AI | 10.0 | 7.1 | 2/2 | 4.17s |
| #7 | Gemini 3.5 Flash medium | 10.0 | 9.0 | 2/2 | 4.07s | |
| #28 | Gemini 2.5 Flash medium | 10.0 | 7.8 | 2/2 | 4.06s | |
| #13 | Grok 4.20 Beta medium | X AI | 10.0 | 8.5 | 2/2 | 4.01s |
| #109 | GLM 5V Turbo none | Z.ai | 10.0 | 5.8 | 2/2 | 3.81s |
| #121 | Owl Alpha none | Openrouter | 10.0 | 5.5 | 2/2 | 3.60s |
| #77 | Claude Sonnet 4.6 none | Anthropic | 10.0 | 6.8 | 2/2 | 3.43s |
| #145 | Laguna M.1 none | Poolside | 10.0 | 4.8 | 2/2 | 3.37s |
| #6 | GPT-5.5 low | OpenAI | 10.0 | 9.0 | 2/2 | 3.28s |
| #151 | Trinity Large Preview none | Arcee AI | 10.0 | 4.6 | 2/2 | 3.26s |