AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↑.
| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #145 | Laguna M.1 none | Poolside | 10.0 | 4.8 | 2/2 | 3.37s |
| #77 | Claude Sonnet 4.6 none | Anthropic | 10.0 | 6.8 | 2/2 | 3.43s |
| #121 | Owl Alpha none | Openrouter | 10.0 | 5.5 | 2/2 | 3.60s |
| #109 | GLM 5V Turbo none | Z.ai | 10.0 | 5.8 | 2/2 | 3.81s |
| #13 | Grok 4.20 Beta medium | X AI | 10.0 | 8.5 | 2/2 | 4.01s |
| #28 | Gemini 2.5 Flash medium | 10.0 | 7.8 | 2/2 | 4.06s | |
| #7 | Gemini 3.5 Flash medium | 10.0 | 9.0 | 2/2 | 4.07s | |
| #65 | Grok 4.20 medium | X AI | 10.0 | 7.1 | 2/2 | 4.17s |
| #9 | GPT-5.5 medium | OpenAI | 10.0 | 8.8 | 2/2 | 4.18s |
| #53 | Gemini 3.1 Flash Lite high | 10.0 | 7.3 | 2/2 | 4.49s | |
| #122 | GLM 4.7 Flash none | Z.ai | 7.3 | 5.5 | 1/2 | 4.82s |
| #92 | Laguna M.1 medium | Poolside | 10.0 | 6.4 | 2/2 | 4.93s |
| #33 | Hy3 preview medium | Tencent | 6.5 | 7.7 | 1/2 | 5.25s |
| #21 | GPT-5.4 medium | OpenAI | 10.0 | 8.0 | 2/2 | 5.32s |
| #1 | Gemini 3 Flash Preview medium | 10.0 | 9.8 | 2/2 | 5.43s |