AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↑.
| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #11 | Gemini 3.1 Flash Lite Preview high | 10.0 | 8.4 | 2/2 | 7.16s | |
| #37 | Claude Opus 4.6 medium | Anthropic | 10.0 | 7.6 | 2/2 | 7.37s |
| #71 | MiniMax M2.5 medium | Minimax | 4.6 | 5.7 | 0/2 | 7.48s |
| #2 | Gemini 3.1 Pro Preview medium | 10.0 | 9.6 | 2/2 | 7.72s | |
| #88 | Nemotron 3 Super none | NVIDIA | 10.0 | 5.1 | 2/2 | 7.92s |
| #72 | Hunter Alpha none | OpenRouter | 10.0 | 5.7 | 2/2 | 8.49s |
| #13 | GLM 5 medium | Z.ai | 7.1 | 8.4 | 1/2 | 8.90s |
| #6 | Seed-2.0-Lite medium | Bytedance Seed | 10.0 | 8.6 | 2/2 | 9.07s |
| #33 | GLM 5.1 medium | Z.ai | 10.0 | 7.8 | 2/2 | 9.33s |
| #5 | Gemini 3 Flash Preview low | 10.0 | 8.8 | 2/2 | 9.40s | |
| #64 | DeepSeek V3.2 none | DeepSeek | 6.3 | 6.1 | 1/2 | 9.42s |
| #31 | GLM 5V Turbo medium | Z.ai | 10.0 | 7.8 | 2/2 | 9.60s |
| #12 | Gemini 3 PRO Preview medium | 10.0 | 8.4 | 2/2 | 10.8s | |
| #45 | GPT-5 Mini medium | OpenAI | 10.0 | 7.0 | 2/2 | 12.6s |
| #26 | Claude Sonnet 4.6 medium | Anthropic | 10.0 | 8.0 | 2/2 | 13.9s |