نیویگیشن
AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs Google: Gemini 3.1 Pro Preview

ماڈل کا نام:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے : 2026-02-27 15:16

خلاصہ

میٹرک Anthropic: Claude Sonnet 4.6 medium اجرا: ریلیز کی تاریخ نامعلوم Google: Gemini 3.1 Pro Preview medium اجرا: ریلیز کی تاریخ نامعلوم
درجہ #8 #2
اسکور 7.43 9.36
تسلسل 9.40 10.00
فی نتیجہ لاگت 8.105 2.443
کل لاگت $0.811 $0.318
درست ٹیسٹس
غلط ٹیسٹس 4 1
فی کوشش کامیابی کی شرح 73.8% 92.9%
غیر مستحکم ٹیسٹ 1 0
آؤٹ پٹ ٹوکنز 29,098 1,000
ریزننگ ٹوکنز 20,435 22,936

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 7.00 10.00 66.7% 0 1,031 1,093
Google: Gemini 3.1 Pro Preview 10.00 10.00 100.0% 0 106 2,533
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 10.00 10.00 100.0% 0 727 907
Google: Gemini 3.1 Pro Preview 10.00 10.00 100.0% 0 292 3,164
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 1.00 7.21 11.1% 1 25,790 16,919
Google: Gemini 3.1 Pro Preview 7.00 10.00 66.7% 0 18 10,688
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 10.00 10.00 100.0% 0 316 523
Google: Gemini 3.1 Pro Preview 10.00 10.00 100.0% 0 72 2,436
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 10.00 10.00 100.0% 0 579 642
Google: Gemini 3.1 Pro Preview 10.00 10.00 100.0% 0 238 3,133
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 10.00 10.00 100.0% 0 655 351
Google: Gemini 3.1 Pro Preview 10.00 10.00 100.0% 0 274 982

موازنہ کی جوڑی تبدیل کریں