AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↓.
| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #69 | Kimi K2.6 none | Moonshot AI | 10.0 | 5.8 | 2/2 | 1.32s |
| #87 | Qwen3 Coder Next none | Qwen | 6.5 | 5.1 | 1/2 | 1.32s |
| #86 | GPT-5.4 Mini none | OpenAI | 10.0 | 5.1 | 2/2 | 1.30s |
| #89 | GPT-4o-mini none | OpenAI | 10.0 | 4.9 | 2/2 | 1.27s |
| #73 | Mistral Small 4 medium | Mistral | 7.3 | 5.7 | 1/2 | 1.23s |
| #29 | Gemini 3.1 Flash Lite Preview none | 10.0 | 7.9 | 2/2 | 1.22s | |
| #63 | Qwen3.5-35B-A3B none | Qwen | 10.0 | 6.1 | 2/2 | 1.16s |
| #96 | GPT-5.4 Nano none | OpenAI | 6.5 | 4.5 | 1/2 | 1.11s |
| #54 | Mercury 2 medium | Inception | 7.3 | 6.5 | 1/2 | 1.11s |
| #75 | GLM 5.1 none | Z.ai | 10.0 | 5.6 | 2/2 | 1.08s |
| #85 | Elephant none | Openrouter | 6.5 | 5.2 | 1/2 | 1.04s |
| #66 | GPT-5.4 none | OpenAI | 10.0 | 5.9 | 2/2 | 1.04s |
| #70 | Qwen3.5-122B-A10B none | Qwen | 10.0 | 5.7 | 2/2 | 1.01s |
| #81 | Elephant medium | Openrouter | 6.5 | 5.2 | 1/2 | 979ms |
| #95 | Grok 4.1 Fast none | X AI | 10.0 | 4.5 | 2/2 | 943ms |