নেভিগেশন
AI BENCHY
তুলনা করুন চার্ট Poddhoti
❤️ Made by XCS
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-Flash

তুলনা করুন:

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-06

মেট্রিক OpenAI: GPT-5.4 none প্রকাশ: 2026-03-05 Qwen: Qwen3.5-Flash medium প্রকাশ: 2026-02-24
গড় স্কোর 4.6 7.0
র‍্যাঙ্ক #44 #24
সঠিক টেস্ট
ধারাবাহিকতা 8.9 7.8
প্রতি ফলাফলে খরচ 1.496 0.565
মোট খরচ $0.090 $0.057
প্রতি চেষ্টায় পাস রেট 44.4% 82.2%
অস্থির টেস্ট 2 4
common.totalRuns 45 (15 x 3) 45 (15 x 3)
আউটপুট টোকেন 1,635 1,708
রিজনিং টোকেন 0 131,466
প্রতিক্রিয়া সময় (গড়) 1.46s 72.86s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 2.89s 234.29s
প্রতিক্রিয়া সময় (মোট) 21.86s 1092.84s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.4 10.0 7.3 11.1% 1 1.41s 388 0
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 71.35s 363 23,645
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.4 10.0 10.0 0.0% 0 2.89s 291 0
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 17.78s 483 8,270
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.4 9.9 10.0 100.0% 0 1.04s 222 0
Qwen: Qwen3.5-Flash 5.5 5.9 83.3% 1 56.99s 235 16,237
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.4 4.0 7.2 44.4% 1 1.07s 50 0
Qwen: Qwen3.5-Flash 4.0 7.2 44.4% 1 146.50s 58 43,615
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.4 5.5 10.0 50.0% 0 1.07s 81 0
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 63.49s 98 14,139
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.4 4.0 9.8 33.3% 0 1.52s 357 0
Qwen: Qwen3.5-Flash 4.0 4.4 77.8% 2 56.74s 162 24,276
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
OpenAI: GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Qwen: Qwen3.5-Flash 10.0 10.0 100.0% 0 10.33s 309 1,284

দ্রুত তুলনা

তুলনার জুটি বদলান