AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: मेट्रिक ↑.
| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #6 | Seed-2.0-Lite medium | Bytedance Seed | 10.0 | 8.6 | 2/2 | 9.07s |
| #7 | GPT-5.3-Codex medium | OpenAI | 10.0 | 8.6 | 2/2 | 3.07s |
| #8 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 10.0 | 8.5 | 2/2 | 46.9s |
| #9 | Qwen3.6 Plus Preview medium | Qwen | 10.0 | 8.5 | 2/2 | 14.9s |
| #10 | Qwen3.5-27B medium | Qwen | 10.0 | 8.4 | 2/2 | 30.3s |
| #11 | Gemini 3.1 Flash Lite Preview high | 10.0 | 8.4 | 2/2 | 7.16s | |
| #12 | Gemini 3 PRO Preview medium | 10.0 | 8.4 | 2/2 | 10.8s | |
| #14 | Gemma 4 31B medium | 10.0 | 8.3 | 2/2 | 21.1s | |
| #15 | Gemini 2.5 Flash medium | 10.0 | 8.2 | 2/2 | 4.06s | |
| #16 | GPT-5.4 medium | OpenAI | 10.0 | 8.2 | 2/2 | 5.32s |
| #17 | Gemini 3.1 Flash Lite Preview medium | 10.0 | 8.2 | 2/2 | 2.29s | |
| #18 | GLM 5 Turbo medium | Z.ai | 10.0 | 8.1 | 2/2 | 6.19s |
| #19 | Qwen3.5-122B-A10B medium | Qwen | 10.0 | 8.1 | 2/2 | 23.4s |
| #20 | Qwen3.6 Plus medium | Qwen | 10.0 | 8.1 | 2/2 | 14.9s |
| #21 | Gemini 3 Flash Preview none | 10.0 | 8.1 | 2/2 | 1.41s |