নেভিগেশন
AI BENCHY
তুলনা করুন চার্ট Poddhoti
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-27B

তুলনা করুন:

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-06

মেট্রিক OpenAI: GPT-5.4 medium প্রকাশ: 2026-03-05 Qwen: Qwen3.5-27B medium প্রকাশ: 2026-02-24
গড় স্কোর 8.2 8.5
র‍্যাঙ্ক #7 #5
সঠিক টেস্ট
ধারাবাহিকতা 8.9 9.5
প্রতি ফলাফলে খরচ 6.533 3.283
মোট খরচ $0.784 $0.394
প্রতি চেষ্টায় পাস রেট 86.7% 82.2%
অস্থির টেস্ট 2 1
common.totalRuns 45 (15 x 3) 45 (15 x 3)
আউটপুট টোকেন 1,611 1,588
রিজনিং টোকেন 46,321 177,639
প্রতিক্রিয়া সময় (গড়) 21.06s 48.85s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 100.41s 163.96s
প্রতিক্রিয়া সময় (মোট) 315.95s 732.75s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 5.02s 216 1,466
Qwen: Qwen3.5-27B 10.0 10.0 100.0% 0 9.69s 102 8,956
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
Qwen: Qwen3.5-27B 10.0 10.0 100.0% 0 163.96s 483 9,991
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 5.32s 234 804
Qwen: Qwen3.5-27B 9.9 10.0 100.0% 0 30.26s 270 16,150
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 74.27s 61 34,748
Qwen: Qwen3.5-27B 4.0 10.0 33.3% 0 79.53s 43 52,368
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Qwen: Qwen3.5-27B 10.0 10.0 100.0% 0 19.66s 97 11,638
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.4 7.0 7.2 88.9% 1 9.13s 442 3,832
Qwen: Qwen3.5-27B 8.3 7.7 77.8% 1 64.61s 245 77,213
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031
Qwen: Qwen3.5-27B 10.0 10.0 100.0% 0 7.45s 348 1,323

দ্রুত তুলনা

তুলনার জুটি বদলান