AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↓.
दाखवलेली मॉडेल्स
15
सरासरी डेटा पार्सिंग आणि निष्कर्षण स्कोअर
8.7
सर्वोत्तम मॉडेल
Gemini 3 Flash Preview 10.0| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #126 | gpt-oss-120b none | OpenAI | 6.5 | 5.4 | 1/2 | 7.12s |
| #130 | MiniMax M2.7 medium | Minimax | 6.3 | 5.3 | 1/2 | 21.9s |
| #132 | Mistral Small 4 medium | Mistral | 7.3 | 5.3 | 1/2 | 1.23s |
| #133 | DeepSeek V3.2 none | DeepSeek | 6.3 | 5.2 | 1/2 | 9.42s |
| #135 | Kimi K2.5 none | Moonshot AI | 7.3 | 5.2 | 1/2 | 42.1s |
| #136 | Elephant Alpha medium | Openrouter | 6.5 | 5.1 | 1/2 | 979ms |
| #137 | Elephant Alpha none | Openrouter | 6.5 | 5.1 | 1/2 | 1.04s |
| #138 | Ling-2.6-flash none | Inclusionai | 6.5 | 5.0 | 1/2 | 8.48s |
| #140 | Qwen3 Coder Next none | Qwen | 6.5 | 4.9 | 1/2 | 1.32s |
| #143 | MiMo-V2.5 none | Xiaomi | 6.5 | 4.9 | 1/2 | 1.01s |
| #148 | GPT-5.4 Nano none | OpenAI | 6.5 | 4.7 | 1/2 | 1.11s |
| #149 | Nemotron 3 Nano Omni 30b A3b Reasoning medium | NVIDIA | 7.3 | 4.6 | 1/2 | 2.72s |
| #150 | Qwen3 Coder Next medium | Qwen | 6.5 | 4.6 | 1/2 | 81.8s |
| #155 | Mercury 2 none | Inception | 7.3 | 4.5 | 1/2 | 667ms |
| #156 | Hy3 preview none | Tencent | 6.5 | 4.4 | 1/2 | 2.85s |