نیویگیشن
AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs Google: Gemini 2.5 Flash

موازنہ کریں:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-03

میٹرک Anthropic: Claude Sonnet 4.6 none اجرا: 2026-02-17 Google: Gemini 2.5 Flash medium اجرا: 2025-06-17
درجہ #22 #16
اوسط اسکور 6.36 7.05
تسلسل 9.50 9.39
فی نتیجہ لاگت 1.325 2.762
کل لاگت $0.106 $0.249
درست ٹیسٹس
فی کوشش کامیابی کی شرح 59.5% 69.1%
غیر مستحکم ٹیسٹ 1 1
آؤٹ پٹ ٹوکنز 2,637 975
ریزننگ ٹوکنز 0 96,701

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 4.00 10.00 33.3% 0 1,199 0
Google: Gemini 2.5 Flash 7.33 10.00 66.7% 0 249 8,832
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 10.00 10.00 100.0% 0 252 0
Google: Gemini 2.5 Flash 9.88 10.00 100.0% 0 279 2,325
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 7.00 10.00 66.7% 0 54 0
Google: Gemini 2.5 Flash 4.00 7.21 55.6% 1 18 80,702
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 5.50 10.00 50.0% 0 90 0
Google: Gemini 2.5 Flash 7.00 9.91 50.0% 0 69 1,203
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 5.00 7.68 44.4% 1 595 0
Google: Gemini 2.5 Flash 7.00 10.00 66.7% 0 126 2,499
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Sonnet 4.6 10.00 10.00 100.0% 0 447 0
Google: Gemini 2.5 Flash 10.00 10.00 100.0% 0 234 1,140

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں