AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↑.
| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #58 | GLM 5V Turbo none | Z.ai | 10.0 | 6.2 | 2/2 | 3.81s |
| #59 | Qwen3.5-Flash none | Qwen | 10.0 | 6.2 | 2/2 | 1.57s |
| #60 | Gemma 4 26B A4B none | 10.0 | 6.2 | 2/2 | 1.70s | |
| #61 | Seed-2.0-Lite none | Bytedance Seed | 10.0 | 6.2 | 2/2 | 1.82s |
| #62 | Gemini 2.5 Flash none | 10.0 | 6.2 | 2/2 | 652ms | |
| #63 | Qwen3.5-35B-A3B none | Qwen | 10.0 | 6.1 | 2/2 | 1.16s |
| #65 | MiMo-V2-Pro none | Xiaomi | 10.0 | 6.0 | 2/2 | 1.39s |
| #66 | GPT-5.4 none | OpenAI | 10.0 | 5.9 | 2/2 | 1.04s |
| #67 | Qwen3.5-27B none | Qwen | 10.0 | 5.9 | 2/2 | 1.43s |
| #69 | Kimi K2.6 none | Moonshot AI | 10.0 | 5.8 | 2/2 | 1.32s |
| #70 | Qwen3.5-122B-A10B none | Qwen | 10.0 | 5.7 | 2/2 | 1.01s |
| #72 | Hunter Alpha none | OpenRouter | 10.0 | 5.7 | 2/2 | 8.49s |
| #75 | GLM 5.1 none | Z.ai | 10.0 | 5.6 | 2/2 | 1.08s |
| #77 | GLM 5 Turbo none | Z.ai | 10.0 | 5.5 | 2/2 | 2.47s |
| #78 | Trinity Large Preview none | Arcee AI | 10.0 | 5.3 | 2/2 | 3.26s |