AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↓.
दाखवलेली मॉडेल्स
15
सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर
8.7
सर्वोत्तम मॉडेल
Gemini 3 Flash Preview 10.0| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #73 | Seed-2.0-Mini medium | Bytedance Seed | 10.0 | 6.9 | 2/2 | 24.3s |
| #74 | Qwen3.6 Max Preview none | Qwen | 10.0 | 6.9 | 2/2 | 2.87s |
| #76 | Kimi K2.5 medium | Moonshot AI | 10.0 | 6.8 | 2/2 | 49.8s |
| #77 | Claude Sonnet 4.6 none | Anthropic | 10.0 | 6.8 | 2/2 | 3.43s |
| #79 | Hunter Alpha medium | OpenRouter | 10.0 | 6.7 | 2/2 | 23.2s |
| #80 | Mimo V2 Omni medium | Xiaomi | 10.0 | 6.7 | 2/2 | 3.04s |
| #84 | Grok 4.20 Multi Agent Beta medium | X AI | 10.0 | 6.6 | 2/2 | 5.54s |
| #85 | Gemma 4 31B none | 10.0 | 6.5 | 2/2 | 2.25s | |
| #86 | Grok 4.1 Fast medium | X AI | 10.0 | 6.5 | 2/2 | 6.63s |
| #87 | Gemini 3.1 Flash Lite minimal | 10.0 | 6.4 | 2/2 | 1.04s | |
| #88 | Qwen3.7 Plus none | Qwen | 10.0 | 6.4 | 2/2 | 1.43s |
| #90 | Gemini 3.1 Flash Lite none | 10.0 | 6.4 | 2/2 | 843ms | |
| #91 | GPT-5.5 none | OpenAI | 10.0 | 6.4 | 2/2 | 1.18s |
| #92 | Laguna M.1 medium | Poolside | 10.0 | 6.4 | 2/2 | 4.93s |
| #93 | Qwen3.6 Plus Preview medium | Qwen | 10.0 | 6.3 | 2/2 | 14.9s |