نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5.4 Nano

خلاصہ

Claude Sonnet 4.6 vs GPT-5.4 Nano benchmark موازنہ: GPT-5.4 Nano average score میں آگے ہے: 7.5 vs 7.3. GPT-5.4 Nano کی benchmark لاگت کم ہے: $0.107 vs $0.316. Claude Sonnet 4.6 تیز ہے: 5.04s vs 11.95s، pass rates 55.6% vs 63.5%.

تجویز کردہ ماڈل: GPT-5.4 Nano - It has the best score here (7.5), while costing about 3.0x less than Claude Sonnet 4.6.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-12

میٹرک Claude Sonnet 4.6 Claude Sonnet 4.6 none اجرا: 2026-02-17 GPT-5.4 Nano GPT-5.4 Nano medium اجرا: 2026-03-17
اسکور 7.3 7.5
درجہ #57 #49
اعتماد پذیری 10.0 10.0
تسلسل 9.7 8.4
درست ٹیسٹس
فی کوشش کامیابی کی شرح 55.6% 63.5%
غیر مستحکم ٹیسٹ 1 4
کل رنز 63 63
فی نتیجہ لاگت 2.870 0.969
کل لاگت $0.316 $0.107
ان پٹ قیمت $3.000 / 1M $0.200 / 1M
آؤٹ پٹ قیمت $15.000 / 1M $1.250 / 1M
کل ان پٹ ٹوکنز 57,886 35,434
آؤٹ پٹ ٹوکنز 9,465 3,014
ریزننگ ٹوکنز 0 76,520
ردِعمل کا وقت (اوسط) 5.04s 11.95s
ردِعمل کا وقت (زیادہ سے زیادہ) 23.84s 94.06s
ردِعمل کا وقت (کل) 70.60s 250.98s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#57 Claude Sonnet 4.6

none
Cost
$0.038
Time
27.3s
Tokens
2,598 tok

#49 GPT-5.4 Nano

medium
Cost
$0.007
Time
24.6s
Tokens
4,943 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 636 1,214 0
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 606 683 2,254
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 5.5 10.0 33.3% 0 5.19s 8,522 2,127 0
GPT-5.4 Nano 6.1 4.7 66.7% 2 19.12s 7,305 516 20,778
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 26,024 3,766 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 12,345 349 5,719
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 8,574 252 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 7,140 234 516
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 759 413 0
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 619 60 43,325
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 513 192 0
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 477 179 443
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 690 90 0
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 660 95 521
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.53s 663 533 0
GPT-5.4 Nano 4.1 7.2 22.2% 1 3.79s 642 594 1,408
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 11,301 447 0
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 5,445 234 382
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 204 431 0
GPT-5.4 Nano 3.0 10.0 0.0% 0 4.81s 195 70 1,174

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں