نیویگیشن
AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5 Mini

موازنہ کریں:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-03

میٹرک Anthropic: Claude Sonnet 4.6 none اجرا: 2026-02-17 OpenAI: GPT-5 Mini medium اجرا: 2025-08-07
درجہ #22 #33
اوسط اسکور 6.36 5.77
تسلسل 9.50 8.79
فی نتیجہ لاگت 1.325 1.200
کل لاگت $0.106 $0.084
درست ٹیسٹس
فی کوشش کامیابی کی شرح 59.5% 57.1%
غیر مستحکم ٹیسٹ 1 2
آؤٹ پٹ ٹوکنز 2,637 4,723
ریزننگ ٹوکنز 0 35,392

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 4.00 10.00 33.3% 0 1,199 0
OpenAI: GPT-5 Mini 7.00 9.62 66.7% 0 1,645 5,824
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 10.00 10.00 100.0% 0 252 0
OpenAI: GPT-5 Mini 9.88 10.00 100.0% 0 453 3,200
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 7.00 10.00 66.7% 0 54 0
OpenAI: GPT-5 Mini 1.00 7.21 22.2% 1 293 14,016
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 5.50 10.00 50.0% 0 90 0
OpenAI: GPT-5 Mini 7.00 6.64 66.7% 1 318 4,992
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 5.00 7.68 44.4% 1 595 0
OpenAI: GPT-5 Mini 4.33 9.78 33.3% 0 1,527 5,760
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 10.00 10.00 100.0% 0 447 0
OpenAI: GPT-5 Mini 10.00 10.00 100.0% 0 487 1,600

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں