AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↑.
| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #134 | GLM 5 Turbo none | Z.ai | 10.0 | 5.2 | 2/2 | 2.47s |
| #70 | GPT-5.4 Nano medium | OpenAI | 10.0 | 7.0 | 2/2 | 2.54s |
| #44 | Gemini 3.1 Flash Lite medium | 10.0 | 7.5 | 2/2 | 2.60s | |
| #149 | Nemotron 3 Nano Omni 30b A3b Reasoning medium | NVIDIA | 7.3 | 4.6 | 1/2 | 2.72s |
| #22 | Step 3.7 Flash medium | Stepfun | 10.0 | 8.0 | 2/2 | 2.75s |
| #114 | Qwen3.5 Plus 2026-04-20 none | Qwen | 10.0 | 5.7 | 2/2 | 2.82s |
| #156 | Hy3 preview none | Tencent | 6.5 | 4.4 | 1/2 | 2.85s |
| #74 | Qwen3.6 Max Preview none | Qwen | 10.0 | 6.9 | 2/2 | 2.87s |
| #50 | Gemini 3.1 Flash Lite Preview low | 10.0 | 7.4 | 2/2 | 3.00s | |
| #80 | Mimo V2 Omni medium | Xiaomi | 10.0 | 6.7 | 2/2 | 3.04s |
| #24 | GPT-5.2 Chat none | OpenAI | 10.0 | 7.9 | 2/2 | 3.05s |
| #15 | GPT-5.3-Codex medium | OpenAI | 10.0 | 8.4 | 2/2 | 3.07s |
| #42 | GPT-5.2 medium | OpenAI | 10.0 | 7.5 | 2/2 | 3.15s |
| #151 | Trinity Large Preview none | Arcee AI | 10.0 | 4.6 | 2/2 | 3.26s |
| #6 | GPT-5.5 low | OpenAI | 10.0 | 9.0 | 2/2 | 3.28s |