AI BENCHY श्रेणी
डेटा पार्सिंग और निष्कर्षण रैंकिंग
देखें कि डेटा पार्सिंग और निष्कर्षण में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↑.
| रैंक | मॉडल | कंपनी | डेटा पार्सिंग और निष्कर्षण स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #145 | Laguna M.1 none | Poolside | 10.0 | 4.8 | 2/2 | 3.37s |
| #77 | Claude Sonnet 4.6 none | Anthropic | 10.0 | 6.8 | 2/2 | 3.43s |
| #121 | Owl Alpha none | Openrouter | 10.0 | 5.5 | 2/2 | 3.60s |
| #109 | GLM 5V Turbo none | Z.ai | 10.0 | 5.8 | 2/2 | 3.81s |
| #13 | Grok 4.20 Beta medium | X AI | 10.0 | 8.5 | 2/2 | 4.01s |
| #28 | Gemini 2.5 Flash medium | 10.0 | 7.8 | 2/2 | 4.06s | |
| #7 | Gemini 3.5 Flash medium | 10.0 | 9.0 | 2/2 | 4.07s | |
| #65 | Grok 4.20 medium | X AI | 10.0 | 7.1 | 2/2 | 4.17s |
| #9 | GPT-5.5 medium | OpenAI | 10.0 | 8.8 | 2/2 | 4.18s |
| #53 | Gemini 3.1 Flash Lite high | 10.0 | 7.3 | 2/2 | 4.49s | |
| #122 | GLM 4.7 Flash none | Z.ai | 7.3 | 5.5 | 1/2 | 4.82s |
| #92 | Laguna M.1 medium | Poolside | 10.0 | 6.4 | 2/2 | 4.93s |
| #33 | Hy3 preview medium | Tencent | 6.5 | 7.7 | 1/2 | 5.25s |
| #21 | GPT-5.4 medium | OpenAI | 10.0 | 8.0 | 2/2 | 5.32s |
| #1 | Gemini 3 Flash Preview medium | 10.0 | 9.8 | 2/2 | 5.43s |