AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: बरोबर चाचण्या ↑.
| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #29 | Qwen3.5-122B-A10B medium | Qwen | 10.0 | 7.8 | 2/2 | 23.4s |
| #30 | Qwen3.5-27B medium | Qwen | 10.0 | 7.8 | 2/2 | 30.3s |
| #31 | DeepSeek V4 Flash high | DeepSeek | 10.0 | 7.7 | 2/2 | 28.0s |
| #32 | Gemini 3.5 Flash minimal | 10.0 | 7.7 | 2/2 | 1.66s | |
| #34 | Qwen3.7 Max none | Qwen | 10.0 | 7.7 | 2/2 | 1.35s |
| #35 | Gemini 3 PRO Preview medium | 10.0 | 7.6 | 2/2 | 10.8s | |
| #36 | Qwen3.5 Plus 2026-04-20 medium | Qwen | 10.0 | 7.6 | 2/2 | 38.3s |
| #37 | Gemma 4 26B A4B medium | 10.0 | 7.6 | 2/2 | 16.5s | |
| #38 | Grok 4.3 medium | X AI | 10.0 | 7.6 | 2/2 | 19.0s |
| #39 | Qwen3.6 Flash medium | Qwen | 10.0 | 7.5 | 2/2 | 9.65s |
| #40 | Gemini 3.1 Flash Lite Preview medium | 10.0 | 7.5 | 2/2 | 2.29s | |
| #41 | Nemotron 3 Ultra 550b A55b medium | NVIDIA | 10.0 | 7.5 | 2/2 | 5.68s |
| #42 | GPT-5.2 medium | OpenAI | 10.0 | 7.5 | 2/2 | 3.15s |
| #44 | Gemini 3.1 Flash Lite medium | 10.0 | 7.5 | 2/2 | 2.60s | |
| #45 | GPT-5.4 Mini medium | OpenAI | 10.0 | 7.5 | 2/2 | 2.43s |