AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↓.
| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #4 | Gemini 3.1 Pro Preview medium | 10.0 | 9.4 | 2/2 | 7.72s | |
| #129 | MiniMax M2.5 medium | Minimax | 4.6 | 5.3 | 0/2 | 7.48s |
| #69 | Claude Opus 4.6 medium | Anthropic | 10.0 | 7.0 | 2/2 | 7.37s |
| #12 | Gemini 3.1 Flash Lite Preview high | 10.0 | 8.6 | 2/2 | 7.16s | |
| #126 | gpt-oss-120b none | OpenAI | 6.5 | 5.4 | 1/2 | 7.12s |
| #86 | Grok 4.1 Fast medium | X AI | 10.0 | 6.5 | 2/2 | 6.63s |
| #2 | Gemini 3.5 Flash high | 10.0 | 9.6 | 2/2 | 6.43s | |
| #56 | MiMo-V2.5 medium | Xiaomi | 2.7 | 7.3 | 0/2 | 6.33s |
| #23 | GLM 5 Turbo medium | Z.ai | 10.0 | 8.0 | 2/2 | 6.19s |
| #89 | Hy3 preview low | Tencent | 6.5 | 6.4 | 1/2 | 5.85s |
| #98 | GLM 5 none | Z.ai | 10.0 | 6.1 | 2/2 | 5.78s |
| #41 | Nemotron 3 Ultra 550b A55b medium | NVIDIA | 10.0 | 7.5 | 2/2 | 5.68s |
| #84 | Grok 4.20 Multi Agent Beta medium | X AI | 10.0 | 6.6 | 2/2 | 5.54s |
| #1 | Gemini 3 Flash Preview medium | 10.0 | 9.8 | 2/2 | 5.43s | |
| #21 | GPT-5.4 medium | OpenAI | 10.0 | 8.0 | 2/2 | 5.32s |