AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा.
दाखवलेली मॉडेल्स
15
सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर
8.7
सर्वोत्तम मॉडेल
DeepSeek V4 Flash 10.0| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #115 | Qwen3.5-27B none | Qwen | 10.0 | 5.7 | 2/2 | 1.43s |
| #116 | Hunter Alpha none | OpenRouter | 10.0 | 5.7 | 2/2 | 8.49s |
| #117 | Qwen3.5-35B-A3B none | Qwen | 10.0 | 5.6 | 2/2 | 1.16s |
| #120 | Mimo V2 PRO none | Xiaomi | 10.0 | 5.6 | 2/2 | 1.39s |
| #121 | Owl Alpha none | Openrouter | 10.0 | 5.5 | 2/2 | 3.60s |
| #123 | MiMo-V2.5-Pro none | Xiaomi | 10.0 | 5.5 | 2/2 | 1.32s |
| #124 | Kimi K2.6 none | Moonshot AI | 10.0 | 5.5 | 2/2 | 1.32s |
| #125 | GPT-5.4 none | OpenAI | 10.0 | 5.5 | 2/2 | 1.04s |
| #127 | Grok 4.20 none | X AI | 10.0 | 5.4 | 2/2 | 522ms |
| #128 | Qwen3.6 Flash none | Qwen | 10.0 | 5.4 | 2/2 | 2.13s |
| #131 | Qwen3.5-122B-A10B none | Qwen | 10.0 | 5.3 | 2/2 | 1.01s |
| #134 | GLM 5 Turbo none | Z.ai | 10.0 | 5.2 | 2/2 | 2.47s |
| #141 | Nemotron 3 Super none | NVIDIA | 10.0 | 4.9 | 2/2 | 7.92s |
| #142 | Mistral Small 4 none | Mistral | 10.0 | 4.9 | 2/2 | 822ms |
| #144 | GPT-5.4 Mini none | OpenAI | 10.0 | 4.9 | 2/2 | 1.30s |