نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs Qwen: Qwen3.7 Plus

خلاصہ

Claude Sonnet 4.6 vs Qwen3.7 Plus benchmark موازنہ: Qwen3.7 Plus average score میں آگے ہے: 8.2 vs 7.3. Qwen3.7 Plus کی benchmark لاگت کم ہے: $0.177 vs $0.316. Claude Sonnet 4.6 تیز ہے: 5.04s vs 38.95s، pass rates 55.6% vs 77.8%.

تجویز کردہ ماڈل: Qwen3.7 Plus - It has the best score here (8.2), while costing about 1.8x less than Claude Sonnet 4.6.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-12

میٹرک Claude Sonnet 4.6 Claude Sonnet 4.6 none اجرا: 2026-02-17 Qwen3.7 Plus Qwen3.7 Plus medium اجرا: 2026-06-03
اسکور 7.3 8.2
درجہ #56 #28
اعتماد پذیری 10.0 10.0
تسلسل 9.7 9.1
درست ٹیسٹس
فی کوشش کامیابی کی شرح 55.6% 77.8%
غیر مستحکم ٹیسٹ 1 2
کل رنز 63 63
فی نتیجہ لاگت 2.870 1.474
کل لاگت $0.316 $0.177
ان پٹ قیمت $3.000 / 1M $0.320 / 1M
آؤٹ پٹ قیمت $15.000 / 1M $1.280 / 1M
کل ان پٹ ٹوکنز 57,886 40,939
آؤٹ پٹ ٹوکنز 9,465 2,125
ریزننگ ٹوکنز 0 125,754
ردِعمل کا وقت (اوسط) 5.04s 38.95s
ردِعمل کا وقت (زیادہ سے زیادہ) 23.84s 178.04s
ردِعمل کا وقت (کل) 70.60s 817.85s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#56 Claude Sonnet 4.6

none
Cost
$0.038
Time
27.3s
Tokens
2,598 tok

#28 Qwen3.7 Plus

medium
Cost
$0.018
Time
193.2s
Tokens
10,821 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
Qwen3.7 Plus 10.0 10.0 100.0% 0 8.58s 672 195 5,065
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
Qwen3.7 Plus 6.1 6.6 55.6% 1 108.60s 6,472 414 43,576
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
Qwen3.7 Plus 10.0 10.0 100.0% 0 65.24s 14,934 366 10,132
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
Qwen3.7 Plus 10.0 10.0 100.0% 0 21.75s 7,782 270 6,713
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
Qwen3.7 Plus 3.6 7.2 22.2% 1 45.35s 771 57 27,073
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
Qwen3.7 Plus 10.0 10.0 100.0% 0 25.48s 516 123 3,998
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
Qwen3.7 Plus 10.0 10.0 100.0% 0 16.13s 699 102 5,013
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
Qwen3.7 Plus 10.0 10.0 100.0% 0 16.38s 696 280 7,312
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
Qwen3.7 Plus 10.0 10.0 100.0% 0 15.02s 8,193 292 1,831
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
Qwen3.7 Plus 3.0 10.0 0.0% 0 91.07s 204 26 15,041

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں