AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↓.
| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #34 | Kimi K2.6 medium | Moonshot AI | 10.0 | 7.7 | 2/2 | 20.4s |
| #94 | MiMo-V2-Flash none | Xiaomi | 2.9 | 4.5 | 0/2 | 19.7s |
| #51 | Nemotron 3 Super medium | NVIDIA | 10.0 | 6.7 | 2/2 | 18.2s |
| #23 | MiMo-V2-Pro medium | Xiaomi | 7.3 | 8.1 | 1/2 | 17.2s |
| #24 | Gemma 4 26B A4B medium | 10.0 | 8.0 | 2/2 | 16.5s | |
| #30 | Step 3.5 Flash medium | Stepfun | 10.0 | 7.9 | 2/2 | 15.0s |
| #9 | Qwen3.6 Plus Preview medium | Qwen | 10.0 | 8.5 | 2/2 | 14.9s |
| #20 | Qwen3.6 Plus medium | Qwen | 10.0 | 8.1 | 2/2 | 14.9s |
| #26 | Claude Sonnet 4.6 medium | Anthropic | 10.0 | 8.0 | 2/2 | 13.9s |
| #45 | GPT-5 Mini medium | OpenAI | 10.0 | 7.0 | 2/2 | 12.6s |
| #12 | Gemini 3 PRO Preview medium | 10.0 | 8.4 | 2/2 | 10.8s | |
| #31 | GLM 5V Turbo medium | Z.ai | 10.0 | 7.8 | 2/2 | 9.60s |
| #64 | DeepSeek V3.2 none | DeepSeek | 6.3 | 6.1 | 1/2 | 9.42s |
| #5 | Gemini 3 Flash Preview low | 10.0 | 8.8 | 2/2 | 9.40s | |
| #33 | GLM 5.1 medium | Z.ai | 10.0 | 7.8 | 2/2 | 9.33s |