AI BENCHY तुलना
OpenAI: GPT-5.4 vs Owl Alpha
बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-30
| मेट्रिक | GPT-5.4 GPT-5.4 none | Owl Alpha Owl Alpha medium |
|---|---|---|
| स्कोर | 5.9 | 5.8 |
| रैंक | #89 | #91 |
| विश्वसनीयता | लागू नहीं | 10.0 |
| संगति | 9.1 | 9.5 |
| सही परीक्षण | ||
| प्रति प्रयास पास दर | 42.6% | 40.7% |
| अस्थिर टेस्ट | 2 | 1 |
| कुल रन | 54 | 54 |
| प्रति परिणाम लागत | 1.477 | 0.000 |
| कुल लागत | $0.104 | $0.000 |
| ???? ??? | $2.500 / 1M | $0.000 / 1M |
| ????? ??? | $15.000 / 1M | $0.000 / 1M |
| आउटपुट टोकन | 2,317 | 1,596 |
| रीजनिंग टोकन | 0 | 0 |
| प्रतिक्रिया समय (औसत) | 1.51s | 11.04s |
| प्रतिक्रिया समय (अधिकतम) | 2.95s | 58.63s |
| प्रतिक्रिया समय (कुल) | 27.21s | 198.65s |
स्कोर बनाम कुल लागत
प्रतिक्रिया समय (औसत)
स्कोर vs प्रतिक्रिया समय (औसत)
कुल आउटपुट टोकन
स्कोर vs कुल आउटपुट टोकन
श्रेणी विवरण
त्वरित तुलना
तुलना जोड़ी बदलें
Kimi K2.6nonevsOwl AlphamediumOwl AlphamediumvsQwen3.5-122B-A10BnoneOwl AlphamediumvsQwen3.5 Plus 2026-04-20noneOwl AlphamediumvsMiMo-V2.5-PrononeOwl AlphamediumvsQwen3.6 FlashnoneOwl AlphamediumvsGLM 5.1noneOwl AlphamediumvsMiMo-V2-PrononeDeepSeek V3.2nonevsOwl AlphamediumOwl AlphamediumvsQwen3.5-27BnoneOwl AlphamediumvsQwen3.6 27BnoneDeepSeek V4 PrononevsOwl AlphamediumMistral Small 4mediumvsGPT-5.4none