AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा.
दाखवलेली मॉडेल्स
15
सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर
9.0
सर्वोत्तम मॉडेल
Step 3.5 Flash 10.0| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #16 | GPT-5.4 medium | OpenAI | 10.0 | 8.2 | 2/2 | 5.32s |
| #17 | Gemini 3.1 Flash Lite Preview medium | 10.0 | 8.2 | 2/2 | 2.29s | |
| #18 | GLM 5 Turbo medium | Z.ai | 10.0 | 8.1 | 2/2 | 6.19s |
| #19 | Qwen3.5-122B-A10B medium | Qwen | 10.0 | 8.1 | 2/2 | 23.4s |
| #20 | Qwen3.6 Plus medium | Qwen | 10.0 | 8.1 | 2/2 | 14.9s |
| #21 | Gemini 3 Flash Preview none | 10.0 | 8.1 | 2/2 | 1.41s | |
| #22 | Gemini 3.1 Flash Lite Preview low | 10.0 | 8.1 | 2/2 | 3.00s | |
| #24 | Gemma 4 26B A4B medium | 10.0 | 8.0 | 2/2 | 16.5s | |
| #25 | Grok 4.20 Beta medium | X AI | 10.0 | 8.0 | 2/2 | 4.01s |
| #26 | Claude Sonnet 4.6 medium | Anthropic | 10.0 | 8.0 | 2/2 | 13.9s |
| #27 | DeepSeek V3.2 medium | DeepSeek | 10.0 | 8.0 | 2/2 | 36.1s |
| #28 | GPT-5.2 Chat none | OpenAI | 10.0 | 7.9 | 2/2 | 3.05s |
| #29 | Gemini 3.1 Flash Lite Preview none | 10.0 | 7.9 | 2/2 | 1.22s | |
| #31 | GLM 5V Turbo medium | Z.ai | 10.0 | 7.8 | 2/2 | 9.60s |
| #33 | GLM 5.1 medium | Z.ai | 10.0 | 7.8 | 2/2 | 9.33s |