AI BENCHY श्रेणी विफलताएँ
Samanya Buddhimatta
गलत उत्तर
Samanya Buddhimatta
गलत उत्तर
देखें कि Samanya Buddhimatta में किन AI मॉडलों में गलत उत्तर आने की सबसे अधिक संभावना है, ताकि आप कमजोरियाँ जल्दी पहचान सकें। क्रमबद्ध करें: प्रतिक्रिया समय (औसत) ↓.
संबंधित विफलता कारण
| रैंक | मॉडल | कंपनी | गलत उत्तर संख्या | श्रेणी स्कोर | सही परीक्षण | प्रतिक्रिया समय (औसत) |
|---|---|---|---|---|---|---|
| #52 | GLM 4.7 Flash medium | Z.ai | 1 | 10.0 | 0/1 | 18.1s |
| #29 | Qwen3.5 Plus 2026-02-15 none | Qwen | 1 | 4.0 | 0/1 | 2.26s |
| #44 | GPT-5.4 none | OpenAI | 1 | 3.0 | 0/1 | 1.78s |
| #49 | GLM 4.7 Flash none | Z.ai | 1 | 3.0 | 0/1 | 1.59s |
| #47 | GPT-4o-mini none | OpenAI | 1 | 3.0 | 0/1 | 909ms |
| #38 | Gemini 2.5 Flash none | 1 | 5.0 | 0/1 | 615ms |