AI BENCHY श्रेणी
डेटा पार्सिंग और निष्कर्षण रैंकिंग
देखें कि डेटा पार्सिंग और निष्कर्षण में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।
| रैंक | मॉडल | कंपनी | डेटा पार्सिंग और निष्कर्षण स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #43 | MiMo-V2.5-Pro medium | Xiaomi | 7.3 | 7.5 | 1/2 | 18.8s |
| #51 | Mimo V2 PRO medium | Xiaomi | 7.3 | 7.4 | 1/2 | 17.2s |
| #57 | Step 3.7 Flash low | Stepfun | 7.3 | 7.3 | 1/2 | 2.29s |
| #68 | Claude Opus 4.8 none | Anthropic | 7.3 | 7.0 | 1/2 | 1.77s |
| #118 | Qwen3.6 27B none | Qwen | 7.3 | 5.6 | 1/2 | 2.06s |
| #122 | GLM 4.7 Flash none | Z.ai | 7.3 | 5.5 | 1/2 | 4.82s |
| #135 | Kimi K2.5 none | Moonshot AI | 7.3 | 5.2 | 1/2 | 42.1s |
| #10 | Claude Opus 4.8 medium | Anthropic | 7.1 | 8.7 | 1/2 | 12.3s |
| #17 | GLM 5 medium | Z.ai | 7.1 | 8.3 | 1/2 | 8.90s |
| #107 | Laguna Xs.2 medium | Poolside | 7.1 | 5.8 | 1/2 | 9.34s |
| #113 | DeepSeek V4 Pro none | DeepSeek | 6.9 | 5.7 | 1/2 | 30.5s |
| #20 | Gemini 3.5 Flash none | 6.5 | 8.1 | 1/2 | 8.10s | |
| #33 | Hy3 preview medium | Tencent | 6.5 | 7.7 | 1/2 | 5.25s |
| #64 | MiMo-V2-Flash medium | Xiaomi | 6.5 | 7.2 | 1/2 | 0ms |
| #82 | Hy3 preview high | Tencent | 6.5 | 6.6 | 1/2 | 12.1s |