AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा.
दाखवलेली मॉडेल्स
15
सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर
8.7
सर्वोत्तम मॉडेल
DeepSeek V4 Flash 10.0| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #145 | Laguna M.1 none | Poolside | 10.0 | 4.8 | 2/2 | 3.37s |
| #146 | Laguna Xs.2 none | Poolside | 10.0 | 4.8 | 2/2 | 646ms |
| #147 | GPT-4o-mini none | OpenAI | 10.0 | 4.8 | 2/2 | 1.27s |
| #151 | Trinity Large Preview none | Arcee AI | 10.0 | 4.6 | 2/2 | 3.26s |
| #153 | Qwen3.6 35B A3B none | Qwen | 10.0 | 4.6 | 2/2 | 1.46s |
| #154 | Qwen3.5-9B none | Qwen | 10.0 | 4.6 | 2/2 | 847ms |
| #157 | Grok 4.1 Fast none | X AI | 10.0 | 4.4 | 2/2 | 943ms |
| #159 | Ling-2.6-1T none | Inclusionai | 10.0 | 4.3 | 2/2 | 1.37s |
| #49 | Qwen3.5-Flash medium | Qwen | 7.3 | 7.4 | 1/2 | 57.0s |
| #66 | Qwen3.5-35B-A3B medium | Qwen | 7.3 | 7.1 | 1/2 | 59.3s |
| #81 | Mercury 2 medium | Inception | 7.3 | 6.6 | 1/2 | 1.11s |
| #103 | DeepSeek V4 Pro high | DeepSeek | 7.3 | 6.0 | 1/2 | 23.6s |
| #132 | Mistral Small 4 medium | Mistral | 7.3 | 5.3 | 1/2 | 1.23s |
| #149 | Nemotron 3 Nano Omni 30b A3b Reasoning medium | NVIDIA | 7.3 | 4.6 | 1/2 | 2.72s |
| #155 | Mercury 2 none | Inception | 7.3 | 4.5 | 1/2 | 667ms |