AI BENCHY श्रेणी
डेटा पार्सिंग और निष्कर्षण रैंकिंग
देखें कि डेटा पार्सिंग और निष्कर्षण में कौन से AI मॉडल सबसे अच्छा प्रदर्शन करते हैं, कौन से भरोसेमंद बने रहते हैं और सबसे बड़े अंतर कहाँ दिखाई देते हैं।
| रैंक | मॉडल | कंपनी | डेटा पार्सिंग और निष्कर्षण स्कोर | स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #145 | Laguna M.1 none | Poolside | 10.0 | 4.8 | 2/2 | 3.37s |
| #146 | Laguna Xs.2 none | Poolside | 10.0 | 4.8 | 2/2 | 646ms |
| #147 | GPT-4o-mini none | OpenAI | 10.0 | 4.8 | 2/2 | 1.27s |
| #151 | Trinity Large Preview none | Arcee AI | 10.0 | 4.6 | 2/2 | 3.26s |
| #153 | Qwen3.6 35B A3B none | Qwen | 10.0 | 4.6 | 2/2 | 1.46s |
| #154 | Qwen3.5-9B none | Qwen | 10.0 | 4.6 | 2/2 | 847ms |
| #157 | Grok 4.1 Fast none | X AI | 10.0 | 4.4 | 2/2 | 943ms |
| #159 | Ling-2.6-1T none | Inclusionai | 10.0 | 4.3 | 2/2 | 1.37s |
| #49 | Qwen3.5-Flash medium | Qwen | 7.3 | 7.4 | 1/2 | 57.0s |
| #66 | Qwen3.5-35B-A3B medium | Qwen | 7.3 | 7.1 | 1/2 | 59.3s |
| #81 | Mercury 2 medium | Inception | 7.3 | 6.6 | 1/2 | 1.11s |
| #103 | DeepSeek V4 Pro high | DeepSeek | 7.3 | 6.0 | 1/2 | 23.6s |
| #132 | Mistral Small 4 medium | Mistral | 7.3 | 5.3 | 1/2 | 1.23s |
| #149 | Nemotron 3 Nano Omni 30b A3b Reasoning medium | NVIDIA | 7.3 | 4.6 | 1/2 | 2.72s |
| #155 | Mercury 2 none | Inception | 7.3 | 4.5 | 1/2 | 667ms |