AI BENCHY श्रेणी
डेटा पार्सिंग और निष्कर्षण रैंकिंग
देखें कि डेटा पार्सिंग और निष्कर्षण में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं। क्रमबद्ध करें: सही परीक्षण ↑.
| रैंक | मॉडल | कंपनी | डेटा पार्सिंग और निष्कर्षण स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #88 | Qwen3.7 Plus none | Qwen | 10.0 | 6.4 | 2/2 | 1.43s |
| #90 | Gemini 3.1 Flash Lite none | 10.0 | 6.4 | 2/2 | 843ms | |
| #91 | GPT-5.5 none | OpenAI | 10.0 | 6.4 | 2/2 | 1.18s |
| #92 | Laguna M.1 medium | Poolside | 10.0 | 6.4 | 2/2 | 4.93s |
| #93 | Qwen3.6 Plus Preview medium | Qwen | 10.0 | 6.3 | 2/2 | 14.9s |
| #95 | Qwen3.5 Plus 2026-02-15 none | Qwen | 10.0 | 6.3 | 2/2 | 1.89s |
| #97 | Gemini 2.5 Flash none | 10.0 | 6.2 | 2/2 | 652ms | |
| #98 | GLM 5 none | Z.ai | 10.0 | 6.1 | 2/2 | 5.78s |
| #101 | Mimo V2 Omni none | Xiaomi | 10.0 | 6.0 | 2/2 | 1.76s |
| #102 | Gemma 4 26B A4B none | 10.0 | 6.0 | 2/2 | 1.70s | |
| #104 | Nemotron 3 Ultra 550b A55b none | NVIDIA | 10.0 | 6.0 | 2/2 | 1.94s |
| #105 | Nemotron 3 Super medium | NVIDIA | 10.0 | 5.8 | 2/2 | 18.2s |
| #106 | Grok 4.20 Beta none | X AI | 10.0 | 5.8 | 2/2 | 601ms |
| #108 | Qwen3.5-Flash none | Qwen | 10.0 | 5.8 | 2/2 | 1.57s |
| #109 | GLM 5V Turbo none | Z.ai | 10.0 | 5.8 | 2/2 | 3.81s |