AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↑.
| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #84 | Grok 4.20 Multi Agent Beta medium | X AI | 10.0 | 6.6 | 2/2 | 5.54s |
| #41 | Nemotron 3 Ultra 550b A55b medium | NVIDIA | 10.0 | 7.5 | 2/2 | 5.68s |
| #98 | GLM 5 none | Z.ai | 10.0 | 6.1 | 2/2 | 5.78s |
| #89 | Hy3 preview low | Tencent | 6.5 | 6.4 | 1/2 | 5.85s |
| #23 | GLM 5 Turbo medium | Z.ai | 10.0 | 8.0 | 2/2 | 6.19s |
| #56 | MiMo-V2.5 medium | Xiaomi | 2.7 | 7.3 | 0/2 | 6.33s |
| #2 | Gemini 3.5 Flash high | 10.0 | 9.6 | 2/2 | 6.43s | |
| #86 | Grok 4.1 Fast medium | X AI | 10.0 | 6.5 | 2/2 | 6.63s |
| #126 | gpt-oss-120b none | OpenAI | 6.5 | 5.4 | 1/2 | 7.12s |
| #12 | Gemini 3.1 Flash Lite Preview high | 10.0 | 8.6 | 2/2 | 7.16s | |
| #69 | Claude Opus 4.6 medium | Anthropic | 10.0 | 7.0 | 2/2 | 7.37s |
| #129 | MiniMax M2.5 medium | Minimax | 4.6 | 5.3 | 0/2 | 7.48s |
| #4 | Gemini 3.1 Pro Preview medium | 10.0 | 9.4 | 2/2 | 7.72s | |
| #141 | Nemotron 3 Super none | NVIDIA | 10.0 | 4.9 | 2/2 | 7.92s |
| #20 | Gemini 3.5 Flash none | 6.5 | 8.1 | 1/2 | 8.10s |