নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

MoonshotAI: Kimi K2.5 vs Qwen: Qwen3.5-9B

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-12

মেট্রিক Kimi K2.5 Kimi K2.5 none প্রকাশ: 2026-01-27 Qwen3.5-9B Qwen3.5-9B medium প্রকাশ: 2026-03-02
র‍্যাঙ্ক #54 #66
গড় স্কোর 4.1 2.6
ধারাবাহিকতা 8.6 7.4
প্রতি ফলাফলে খরচ 0.295 0.779
মোট খরচ $0.015 $0.024
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 39.6% 35.4%
অস্থির টেস্ট 3 5
মোট রান 48 48
আউটপুট টোকেন 2,000 17,930
রিজনিং টোকেন 0 139,706
প্রতিক্রিয়া সময় (গড়) 11.91s 71.44s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 42.13s 226.38s
প্রতিক্রিয়া সময় (মোট) 107.16s 928.77s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

গড় স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.5 2.7 7.9 11.1% 1 11.38s 363 0
Qwen3.5-9B 4.0 7.2 55.6% 1 31.54s 2,410 10,913
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.5 10.0 2.1 33.3% 1 19.16s 748 0
Qwen3.5-9B 10.0 10.0 0.0% 0 0ms 0 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.5 5.4 5.8 83.3% 1 42.13s 187 0
Qwen3.5-9B 5.0 5.6 33.3% 1 87.31s 1,383 32,113
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.5 4.0 10.0 33.3% 0 4.38s 29 0
Qwen3.5-9B 10.0 7.2 22.2% 1 137.75s 11,549 48,475
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.5 10.0 10.0 100.0% 0 4.00s 76 0
Qwen3.5-9B 10.0 1.6 33.3% 1 226.38s 0 30,695
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.5 5.5 10.0 50.0% 0 2.67s 60 0
Qwen3.5-9B 5.5 5.8 66.7% 1 17.15s 599 4,517
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.5 10.0 10.0 0.0% 0 4.73s 317 0
Qwen3.5-9B 10.0 10.0 0.0% 0 33.38s 1,545 11,844
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Kimi K2.5 10.0 10.0 100.0% 0 13.99s 220 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 444 1,149

দ্রুত তুলনা

তুলনার জুটি বদলান