نیویگیشن
AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs OpenAI: GPT-5.2 Chat

موازنہ کریں:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-03

میٹرک Anthropic: Claude Sonnet 4.6 medium اجرا: 2026-02-17 OpenAI: GPT-5.2 Chat none اجرا: 2025-12-11
درجہ #11 #12
اوسط اسکور 7.43 7.41
تسلسل 9.40 9.45
فی نتیجہ لاگت 8.105 2.261
کل لاگت $0.811 $0.227
درست ٹیسٹس
فی کوشش کامیابی کی شرح 73.8% 73.8%
غیر مستحکم ٹیسٹ 1 1
آؤٹ پٹ ٹوکنز 29,098 14,267
ریزننگ ٹوکنز 20,435 0

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 7.00 10.00 66.7% 0 1,031 1,093
OpenAI: GPT-5.2 Chat 10.00 10.00 100.0% 0 1,651 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 10.00 10.00 100.0% 0 727 907
OpenAI: GPT-5.2 Chat 9.88 10.00 100.0% 0 980 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 1.00 7.21 11.1% 1 25,790 16,919
OpenAI: GPT-5.2 Chat 4.00 10.00 33.3% 0 7,810 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 10.00 10.00 100.0% 0 316 523
OpenAI: GPT-5.2 Chat 5.50 6.13 66.7% 1 1,528 0
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 10.00 10.00 100.0% 0 579 642
OpenAI: GPT-5.2 Chat 7.00 10.00 66.7% 0 1,743 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 10.00 10.00 100.0% 0 655 351
OpenAI: GPT-5.2 Chat 10.00 10.00 100.0% 0 555 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں