#106

Qwen3.5-9B

Qwen اجرا: 2026-03-02 ٹیسٹ کیا گیا: 2026-04-20 17:48 qwen/qwen3.5-9b::medium

(medium) (none)

خلاصہ

Qwen3.5-9B AI BENCHY پر 4.4 اسکور کرتا ہے اور #106 پر ہے۔ اس کی reliability دستیاب نہیں، pass rate 33.3%، کل لاگت $0.030، اور اوسط response time 73.64s ہے۔

Qwen3.5-9B کو منفرد کیا بناتا ہے: اس score range کے لیے اس کی کل benchmark لاگت غیر معمولی طور پر کم ہے۔

اسکور

4.4

تسلسل

7.2

اعتماد پذیری

دستیاب نہیں

کل لاگت (موجودہ قیمت)

$0.030

کل آؤٹ پٹ ٹوکنز

196,888

کل ان پٹ ٹوکنز

ان پٹ قیمت

$0.100 / 1M

آؤٹ پٹ قیمت

$0.150 / 1M

درست ٹیسٹس

غلط ٹیسٹس: 15

فی کوشش کامیابی کی شرح: 33.3%

غیر مستحکم ٹیسٹ

غیر مستحکم ٹیسٹس میں رنز کے درمیان ملے جلے نتائج آئے (کم از کم ایک کامیاب اور ایک ناکام).

ردِعمل کا وقت (اوسط)

73.64s

ردِعمل کا وقت (زیادہ سے زیادہ): 226.38s

ردِعمل کا وقت (کل): 1104.60s

ٹائم آؤٹ: 11 ہدایات پر عمل نہیں کیا: 2 اضافی فارمیٹنگ: 1 غلط جواب: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#106 Qwen3.5-9B

medium

لاگت: $0.001
وقت: 35.9s
ٹوکنز: 3,030 tok

رن ہسٹری

ٹیسٹ کیا گیا	اسکور	اعتماد پذیری	کل لاگت	موازنہ کریں
2026-07-16 23:12 نیا ٹیسٹ شامل ہوا	3.8	5.0	$0.036 ↑	موازنہ کریں
2026-06-04 13:41 نیا ٹیسٹ شامل ہوا	4.2	5.6	$0.035 ↓	موازنہ کریں
2026-05-22 00:18 سوٹ بدل گیا	4.2	1.7	$0.035	موازنہ کریں
2026-05-08 14:44 سوٹ بدل گیا	4.3	3.3	$0.035	موازنہ کریں
2026-05-08 14:44 سوٹ بدل گیا	4.3	3.3	$0.035	موازنہ کریں
2026-04-20 17:48 پہلا ریکارڈ شدہ رن	4.4	دستیاب نہیں	$0.030	موجودہ رن

چارٹس

پہلا ماڈل منتخب کریں، پھر دوسرا ماڈل کلک کریں تاکہ سائیڈ بائی سائیڈ صفحہ کھلے۔

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور vs کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

فوری موازنہ

Qwen3.5-9BmediumvsGranite 4.1 8Bnone Qwen3.5-9Bmediumvsgpt-oss-120bnoneمفت دستیاب Qwen3.5-9BmediumvsGrok 4.20none Qwen3.5-9BmediumvsGLM 4.7 Flashmedium Qwen3.5-9BmediumvsLaguna S 2.1noneمفت دستیاب Qwen3.5-9BmediumvsMiniMax M2.5medium Qwen3.5-9BmediumvsMercury 2none Qwen3.5-9BmediumvsCobuddymedium Qwen3.5-9BmediumvsQwen3 Coder Nextmedium Qwen3.5-9BmediumvsTrinity Large Previewnone

زمرہ وار تفصیل

زمرہ	اسکور	تسلسل
اینٹی اے آئی چالیں	5.1	5.8
کوڈنگ	2.6	10.0
مشترکہ	3.0	10.0
ڈیٹا پارسنگ اور استخراج	3.6	5.6
ڈومین مخصوص	3.6	7.2
عمومی ذہانت	2.8	1.6
ہدایات کی پیروی	6.4	5.8
پہیلی حل کرنا	3.1	10.0
ٹول کالنگ	10.0	10.0

Qwen3.5-9B

Hamster playing table tennis

#106 Qwen3.5-9B

چارٹس

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور vs کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

فوری موازنہ

زمرہ وار تفصیل

موازنہ کیے گئے ماڈلز