AI BENCHY श्रेणी अपयशे
डेटा पार्सिंग आणि निष्कर्षण: API त्रुटी
डेटा पार्सिंग आणि निष्कर्षण
API त्रुटी
डेटा पार्सिंग आणि निष्कर्षण मध्ये कोणत्या AI मॉडेल्सना API त्रुटी येण्याची शक्यता जास्त आहे ते पाहा, म्हणजे कमकुवत बाजू लवकर ओळखता येतील. क्रम लावा: प्रतिसाद वेळ (सरासरी) ↓.
अयशस्वी होण्याची कारणे
| क्रमांक | मॉडेल | कंपनी | API त्रुटी संख्या | श्रेणी स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #43 | Qwen3.5-35B-A3B medium | Qwen | 1 | 7.3 | 1/2 | 59.3s |
| #32 | Qwen3.5-Flash medium | Qwen | 1 | 7.3 | 1/2 | 57.0s |
| #94 | MiMo-V2-Flash none | Xiaomi | 1 | 2.9 | 0/2 | 19.7s |
| #84 | gpt-oss-120b none | OpenAI | 1 | 6.5 | 1/2 | 7.12s |
| #73 | Mistral Small 4 medium | Mistral | 1 | 7.3 | 1/2 | 1.23s |
| #41 | MiMo-V2-Flash medium | Xiaomi | 1 | 6.5 | 1/2 | 0ms |