নেভিগেশন
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 Mini vs Qwen: Qwen3.5-9B

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-17

মেট্রিক GPT-5.4 Mini GPT-5.4 Mini none প্রকাশ: 2026-03-17 Qwen3.5-9B Qwen3.5-9B medium প্রকাশ: 2026-03-02
র‍্যাঙ্ক #66 #70
স্কোর 4.8 4.5
ধারাবাহিকতা 8.6 7.0
প্রতি ফলাফলে খরচ 0.737 0.787
মোট খরচ $0.030 $0.024
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 31.4% 35.3%
অস্থির টেস্ট 3 6
মোট রান 51 51
আউটপুট টোকেন 2,085 18,141
রিজনিং টোকেন 0 141,204
প্রতিক্রিয়া সময় (গড়) 1.17s 69.21s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 2.52s 226.38s
প্রতিক্রিয়া সময় (মোট) 19.82s 968.99s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 2,621 12,411
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 1,383 32,113
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 11,549 48,475
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 0 30,695
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
Qwen3.5-9B 6.4 5.8 66.7% 1 17.15s 599 4,517
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
Qwen3.5-9B 3.1 10.0 0.0% 0 33.38s 1,545 11,844
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 444 1,149

দ্রুত তুলনা

তুলনার জুটি বদলান