AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↑.
| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #10 | Claude Opus 4.8 medium | Anthropic | 7.1 | 8.7 | 1/2 | 12.3s |
| #54 | GPT-5 Mini medium | OpenAI | 10.0 | 7.3 | 2/2 | 12.6s |
| #46 | Qwen3.6 35B A3B medium | Qwen | 10.0 | 7.4 | 2/2 | 13.0s |
| #52 | Claude Sonnet 4.6 medium | Anthropic | 10.0 | 7.4 | 2/2 | 13.9s |
| #71 | Step 3.7 Flash high | Stepfun | 10.0 | 7.0 | 2/2 | 14.7s |
| #67 | MiniMax M3 medium | Minimax | 10.0 | 7.1 | 2/2 | 14.9s |
| #26 | Qwen3.6 Plus medium | Qwen | 10.0 | 7.9 | 2/2 | 14.9s |
| #93 | Qwen3.6 Plus Preview medium | Qwen | 10.0 | 6.3 | 2/2 | 14.9s |
| #62 | Step 3.5 Flash medium | Stepfun | 10.0 | 7.2 | 2/2 | 15.0s |
| #37 | Gemma 4 26B A4B medium | 10.0 | 7.6 | 2/2 | 16.5s | |
| #51 | Mimo V2 PRO medium | Xiaomi | 7.3 | 7.4 | 1/2 | 17.2s |
| #119 | Cobuddy medium | Baidu | 6.3 | 5.6 | 1/2 | 17.4s |
| #105 | Nemotron 3 Super medium | NVIDIA | 10.0 | 5.8 | 2/2 | 18.2s |
| #43 | MiMo-V2.5-Pro medium | Xiaomi | 7.3 | 7.5 | 1/2 | 18.8s |
| #38 | Grok 4.3 medium | X AI | 10.0 | 7.6 | 2/2 | 19.0s |