AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↑.
| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #57 | GPT-5 Nano medium | OpenAI | 3.7 | 6.3 | 0/2 | 21.4s |
| #71 | MiniMax M2.5 medium | Minimax | 4.6 | 5.7 | 0/2 | 7.48s |
| #94 | MiMo-V2-Flash none | Xiaomi | 2.9 | 4.5 | 0/2 | 19.7s |
| #97 | Qwen3.5-9B medium | Qwen | 3.6 | 4.4 | 0/2 | 87.3s |
| #98 | LFM2-24B-A2B none | Liquid | 3.0 | 4.1 | 0/2 | 714ms |
| #13 | GLM 5 medium | Z.ai | 7.1 | 8.4 | 1/2 | 8.90s |
| #23 | MiMo-V2-Pro medium | Xiaomi | 7.3 | 8.1 | 1/2 | 17.2s |
| #32 | Qwen3.5-Flash medium | Qwen | 7.3 | 7.8 | 1/2 | 57.0s |
| #41 | MiMo-V2-Flash medium | Xiaomi | 6.5 | 7.5 | 1/2 | 0ms |
| #43 | Qwen3.5-35B-A3B medium | Qwen | 7.3 | 7.4 | 1/2 | 59.3s |
| #54 | Mercury 2 medium | Inception | 7.3 | 6.5 | 1/2 | 1.11s |
| #64 | DeepSeek V3.2 none | DeepSeek | 6.3 | 6.1 | 1/2 | 9.42s |
| #68 | gpt-oss-120b medium | OpenAI | 6.4 | 5.8 | 1/2 | 1.98s |
| #73 | Mistral Small 4 medium | Mistral | 7.3 | 5.7 | 1/2 | 1.23s |
| #74 | GLM 4.7 Flash none | Z.ai | 7.3 | 5.6 | 1/2 | 4.82s |