AI BENCHY Compare
OpenAI: GPT-5.4 vs Owl Alpha
AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-04-30
| মেট্রিক | GPT-5.4 GPT-5.4 none | Owl Alpha Owl Alpha medium |
|---|---|---|
| স্কোর | 5.9 | 5.8 |
| র্যাঙ্ক | #89 | #91 |
| নির্ভরযোগ্যতা | প্রযোজ্য নয় | 10.0 |
| ধারাবাহিকতা | 9.1 | 9.5 |
| সঠিক টেস্ট | ||
| প্রতি চেষ্টায় পাস রেট | 42.6% | 40.7% |
| অস্থির টেস্ট | 2 | 1 |
| মোট রান | 54 | 54 |
| প্রতি ফলাফলে খরচ | 1.477 | 0.000 |
| মোট খরচ | $0.104 | $0.000 |
| ???? ??? | $2.500 / 1M | $0.000 / 1M |
| ????? ??? | $15.000 / 1M | $0.000 / 1M |
| আউটপুট টোকেন | 2,317 | 1,596 |
| রিজনিং টোকেন | 0 | 0 |
| প্রতিক্রিয়া সময় (গড়) | 1.51s | 11.04s |
| প্রতিক্রিয়া সময় (সর্বোচ্চ) | 2.95s | 58.63s |
| প্রতিক্রিয়া সময় (মোট) | 27.21s | 198.65s |
স্কোর বনাম মোট খরচ
প্রতিক্রিয়া সময় (গড়)
স্কোর vs প্রতিক্রিয়া সময় (গড়)
মোট আউটপুট টোকেন
স্কোর vs মোট আউটপুট টোকেন
বিভাগভিত্তিক বিশ্লেষণ
দ্রুত তুলনা
তুলনার জুটি বদলান
Kimi K2.6nonevsOwl AlphamediumOwl AlphamediumvsQwen3.5-122B-A10BnoneOwl AlphamediumvsQwen3.5 Plus 2026-04-20noneOwl AlphamediumvsMiMo-V2.5-PrononeOwl AlphamediumvsQwen3.6 FlashnoneOwl AlphamediumvsGLM 5.1noneOwl AlphamediumvsMiMo-V2-PrononeDeepSeek V3.2nonevsOwl AlphamediumOwl AlphamediumvsQwen3.5-27BnoneOwl AlphamediumvsQwen3.6 27BnoneDeepSeek V4 PrononevsOwl AlphamediumMistral Small 4mediumvsGPT-5.4none