AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा.
दाखवलेली मॉडेल्स
15
सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर
8.7
सर्वोत्तम मॉडेल
DeepSeek V4 Flash 10.0| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #50 | Gemini 3.1 Flash Lite Preview low | 10.0 | 7.4 | 2/2 | 3.00s | |
| #52 | Claude Sonnet 4.6 medium | Anthropic | 10.0 | 7.4 | 2/2 | 13.9s |
| #53 | Gemini 3.1 Flash Lite high | 10.0 | 7.3 | 2/2 | 4.49s | |
| #54 | GPT-5 Mini medium | OpenAI | 10.0 | 7.3 | 2/2 | 12.6s |
| #55 | GLM 5.1 medium | Z.ai | 10.0 | 7.3 | 2/2 | 9.33s |
| #58 | Gemini 3.1 Flash Lite Preview none | 10.0 | 7.2 | 2/2 | 1.22s | |
| #59 | GLM 5V Turbo medium | Z.ai | 10.0 | 7.2 | 2/2 | 9.60s |
| #60 | Kimi K2.6 medium | Moonshot AI | 10.0 | 7.2 | 2/2 | 20.4s |
| #61 | Gemini 3.1 Flash Lite low | 10.0 | 7.2 | 2/2 | 1.44s | |
| #63 | GPT-5.3 Chat none | OpenAI | 10.0 | 7.2 | 2/2 | 2.21s |
| #65 | Grok 4.20 medium | X AI | 10.0 | 7.1 | 2/2 | 4.17s |
| #67 | MiniMax M3 medium | Minimax | 10.0 | 7.1 | 2/2 | 14.9s |
| #69 | Claude Opus 4.6 medium | Anthropic | 10.0 | 7.0 | 2/2 | 7.37s |
| #70 | GPT-5.4 Nano medium | OpenAI | 10.0 | 7.0 | 2/2 | 2.54s |
| #71 | Step 3.7 Flash high | Stepfun | 10.0 | 7.0 | 2/2 | 14.7s |