AI BENCHY
موازنہ کریں چارٹس
❤️ XCS
Your ad here

#5

Qwen: Qwen3.5-27B

Qwen · qwen/qwen3.5-27b::medium

ماڈل موازنہ منتخب کنندہ کھولیں

اوسط اسکور

8.56

فی نتیجہ لاگت

2.950

تسلسل

9.56

کل لاگت

$0.325

درست ٹیسٹس

11/14

کوئی ٹیسٹ تبھی مکمل کامیاب شمار ہوگا جب اس کے تمام رنز کامیاب ہوں

غلط ٹیسٹس

3

فی کوشش کامیابی کی شرح: 83.3%

غیر مستحکم ٹیسٹ

1

ردِعمل کا وقت: اوسط 33.79s · کل 473.12s · زیادہ سے زیادہ 95.52s

ہدایات پر عمل نہیں کیا: 1 ٹائم آؤٹ: 1 غلط جواب: 1

اسکور کے لحاظ سے سرفہرست ماڈلز

پہلا ماڈل منتخب کریں، پھر دوسرا ماڈل کلک کریں تاکہ سائیڈ بائی سائیڈ صفحہ کھلے۔

زمرہ وار تفصیل

زمرہ اوسط اسکور تسلسل درست ٹیسٹس
Anti-AI Tricks 10.00 10.00 3/3
Data parsing and extraction 9.88 10.00 2/2
Domain specific 4.00 10.00 1/3
Instructions following 9.00 6.88 1/2
Puzzle Solving 10.00 10.00 3/3
Tool Calling 10.00 10.00 1/1