AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↓.
दाखवलेली मॉडेल्स
15
सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर
8.7
सर्वोत्तम मॉडेल
Gemini 3 Flash Preview 10.0| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #116 | Hunter Alpha none | OpenRouter | 10.0 | 5.7 | 2/2 | 8.49s |
| #117 | Qwen3.5-35B-A3B none | Qwen | 10.0 | 5.6 | 2/2 | 1.16s |
| #120 | Mimo V2 PRO none | Xiaomi | 10.0 | 5.6 | 2/2 | 1.39s |
| #121 | Owl Alpha none | Openrouter | 10.0 | 5.5 | 2/2 | 3.60s |
| #123 | MiMo-V2.5-Pro none | Xiaomi | 10.0 | 5.5 | 2/2 | 1.32s |
| #124 | Kimi K2.6 none | Moonshot AI | 10.0 | 5.5 | 2/2 | 1.32s |
| #125 | GPT-5.4 none | OpenAI | 10.0 | 5.5 | 2/2 | 1.04s |
| #127 | Grok 4.20 none | X AI | 10.0 | 5.4 | 2/2 | 522ms |
| #128 | Qwen3.6 Flash none | Qwen | 10.0 | 5.4 | 2/2 | 2.13s |
| #131 | Qwen3.5-122B-A10B none | Qwen | 10.0 | 5.3 | 2/2 | 1.01s |
| #134 | GLM 5 Turbo none | Z.ai | 10.0 | 5.2 | 2/2 | 2.47s |
| #139 | DeepSeek V4 Flash none | DeepSeek | 10.0 | 5.0 | 2/2 | 23.8s |
| #141 | Nemotron 3 Super none | NVIDIA | 10.0 | 4.9 | 2/2 | 7.92s |
| #142 | Mistral Small 4 none | Mistral | 10.0 | 4.9 | 2/2 | 822ms |
| #144 | GPT-5.4 Mini none | OpenAI | 10.0 | 4.9 | 2/2 | 1.30s |