AI BENCHY
موازنہ کریں چارٹس
❤️ XCS
Your ad here

#35

Qwen: Qwen3.5-Flash

Qwen · qwen/qwen3.5-flash-02-23::none

ماڈل موازنہ منتخب کنندہ کھولیں

اوسط اسکور

3.63

فی نتیجہ لاگت

0.084

تسلسل

8.32

کل لاگت

$0.003

درست ٹیسٹس

3/14

کوئی ٹیسٹ تبھی مکمل کامیاب شمار ہوگا جب اس کے تمام رنز کامیاب ہوں

غلط ٹیسٹس

11

فی کوشش کامیابی کی شرح: 33.3%

غیر مستحکم ٹیسٹ

3

ردِعمل کا وقت: اوسط 3.55s · کل 49.72s · زیادہ سے زیادہ 13.73s

غلط جواب: 7 API خرابی: 2 ہدایات پر عمل نہیں کیا: 2

اسکور کے لحاظ سے سرفہرست ماڈلز

پہلا ماڈل منتخب کریں، پھر دوسرا ماڈل کلک کریں تاکہ سائیڈ بائی سائیڈ صفحہ کھلے۔

زمرہ وار تفصیل

زمرہ اوسط اسکور تسلسل درست ٹیسٹس
Anti-AI Tricks 2.34 7.76 0/3
Data parsing and extraction 5.38 5.81 1/2
Domain specific 4.00 7.21 1/3
Instructions following 3.50 9.99 0/2
Puzzle Solving 1.34 10.00 0/3
Tool Calling 10.00 10.00 1/1