AI BENCHY श्रेणी
डेटा पार्सिंग आणि निष्कर्षण क्रमवारी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणती AI मॉडेल्स सर्वोत्तम काम करतात, कोणती विश्वासार्ह राहतात आणि सर्वात मोठी दरी कुठे दिसते ते पाहा. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↑.
| क्रमांक | मॉडेल | कंपनी | डेटा पार्सिंग आणि निष्कर्षण स्कोअर | स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #124 | Kimi K2.6 none | Moonshot AI | 10.0 | 5.5 | 2/2 | 1.32s |
| #34 | Qwen3.7 Max none | Qwen | 10.0 | 7.7 | 2/2 | 1.35s |
| #159 | Ling-2.6-1T none | Inclusionai | 10.0 | 4.3 | 2/2 | 1.37s |
| #120 | Mimo V2 PRO none | Xiaomi | 10.0 | 5.6 | 2/2 | 1.39s |
| #48 | Gemini 3 Flash Preview none | 10.0 | 7.4 | 2/2 | 1.41s | |
| #162 | Nemotron 3 Nano Omni 30b A3b Reasoning none | NVIDIA | 3.8 | 4.1 | 0/2 | 1.42s |
| #115 | Qwen3.5-27B none | Qwen | 10.0 | 5.7 | 2/2 | 1.43s |
| #88 | Qwen3.7 Plus none | Qwen | 10.0 | 6.4 | 2/2 | 1.43s |
| #61 | Gemini 3.1 Flash Lite low | 10.0 | 7.2 | 2/2 | 1.44s | |
| #153 | Qwen3.6 35B A3B none | Qwen | 10.0 | 4.6 | 2/2 | 1.46s |
| #158 | GLM 4.7 Flash medium | Z.ai | 6.3 | 4.4 | 1/2 | 1.51s |
| #108 | Qwen3.5-Flash none | Qwen | 10.0 | 5.8 | 2/2 | 1.57s |
| #32 | Gemini 3.5 Flash minimal | 10.0 | 7.7 | 2/2 | 1.66s | |
| #102 | Gemma 4 26B A4B none | 10.0 | 6.0 | 2/2 | 1.70s | |
| #101 | Mimo V2 Omni none | Xiaomi | 10.0 | 6.0 | 2/2 | 1.76s |