নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-9B

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-12

মেট্রিক GPT-5.4 GPT-5.4 none প্রকাশ: 2026-03-05 Qwen3.5-9B Qwen3.5-9B medium প্রকাশ: 2026-03-02
র‍্যাঙ্ক #51 #66
গড় স্কোর 4.5 2.6
ধারাবাহিকতা 8.9 7.4
প্রতি ফলাফলে খরচ 1.562 0.779
মোট খরচ $0.094 $0.024
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 41.7% 35.4%
অস্থির টেস্ট 2 5
মোট রান 48 48
আউটপুট টোকেন 1,819 17,930
রিজনিং টোকেন 0 139,706
প্রতিক্রিয়া সময় (গড়) 1.48s 71.44s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 2.89s 226.38s
প্রতিক্রিয়া সময় (মোট) 23.64s 928.77s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

গড় স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 7.3 11.1% 1 1.41s 388 0
Qwen3.5-9B 4.0 7.2 55.6% 1 31.54s 2,410 10,913
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 0.0% 0 2.89s 291 0
Qwen3.5-9B 10.0 10.0 0.0% 0 0ms 0 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 9.9 10.0 100.0% 0 1.04s 222 0
Qwen3.5-9B 5.0 5.6 33.3% 1 87.31s 1,383 32,113
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 4.0 7.2 44.4% 1 1.07s 50 0
Qwen3.5-9B 10.0 7.2 22.2% 1 137.75s 11,549 48,475
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 3.0 9.9 0.0% 0 1.78s 184 0
Qwen3.5-9B 10.0 1.6 33.3% 1 226.38s 0 30,695
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 5.5 10.0 50.0% 0 1.07s 81 0
Qwen3.5-9B 5.5 5.8 66.7% 1 17.15s 599 4,517
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 4.0 9.8 33.3% 0 1.52s 357 0
Qwen3.5-9B 10.0 10.0 0.0% 0 33.38s 1,545 11,844
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 444 1,149

দ্রুত তুলনা

তুলনার জুটি বদলান