AI BENCHY श्रेणी अपयशे
सूचनांचे पालन: API त्रुटी
सूचनांचे पालन
API त्रुटी
सूचनांचे पालन मध्ये कोणत्या AI मॉडेल्सना API त्रुटी येण्याची शक्यता जास्त आहे ते पाहा, म्हणजे कमकुवत बाजू लवकर ओळखता येतील. क्रम लावा: बरोबर चाचण्या ↓.
अयशस्वी होण्याची कारणे
| क्रमांक | मॉडेल | कंपनी | API त्रुटी संख्या | श्रेणी स्कोअर | बरोबर चाचण्या | प्रतिसाद वेळ (सरासरी) |
|---|---|---|---|---|---|---|
| #47 | Grok 4.20 medium | X AI | 1 | 7.3 | 1/2 | 4.42s |