AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा.
दाखवलेली मॉडेल्स
15
सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर
9.0
सर्वोत्तम मॉडेल
Step 3.5 Flash 10.0| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #30 | Step 3.5 Flash medium | Stepfun | 10.0 | 7.9 | 2/2 | 15.0s |
| #1 | Gemini 3 Flash Preview medium | 10.0 | 10.0 | 2/2 | 4.72s | |
| #2 | Gemini 3.1 Pro Preview medium | 10.0 | 9.6 | 2/2 | 7.72s | |
| #3 | Claude Opus 4.7 medium | Anthropic | 10.0 | 9.2 | 2/2 | 2.37s |
| #4 | Claude Opus 4.7 none | Anthropic | 10.0 | 9.2 | 2/2 | 2.15s |
| #5 | Gemini 3 Flash Preview low | 10.0 | 8.8 | 2/2 | 9.40s | |
| #6 | Seed-2.0-Lite medium | Bytedance Seed | 10.0 | 8.6 | 2/2 | 9.07s |
| #7 | GPT-5.3-Codex medium | OpenAI | 10.0 | 8.6 | 2/2 | 3.07s |
| #8 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 10.0 | 8.5 | 2/2 | 46.9s |
| #9 | Qwen3.6 Plus Preview medium | Qwen | 10.0 | 8.5 | 2/2 | 14.9s |
| #10 | Qwen3.5-27B medium | Qwen | 10.0 | 8.4 | 2/2 | 30.3s |
| #11 | Gemini 3.1 Flash Lite Preview high | 10.0 | 8.4 | 2/2 | 7.16s | |
| #12 | Gemini 3 PRO Preview medium | 10.0 | 8.4 | 2/2 | 10.8s | |
| #14 | Gemma 4 31B medium | 10.0 | 8.3 | 2/2 | 21.1s | |
| #15 | Gemini 2.5 Flash medium | 10.0 | 8.2 | 2/2 | 4.06s |