نیویگیشن
AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Google: Gemini 2.5 Flash

موازنہ کریں:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-03

میٹرک Anthropic: Claude Opus 4.6 medium اجرا: 2026-02-05 Google: Gemini 2.5 Flash none اجرا: 2025-06-17
درجہ #28 #36
اوسط اسکور 6.07 5.34
تسلسل 8.80 9.40
فی نتیجہ لاگت 10.992 0.107
کل لاگت $0.880 $0.007
درست ٹیسٹس
فی کوشش کامیابی کی شرح 61.9% 47.6%
غیر مستحکم ٹیسٹ 2 1
آؤٹ پٹ ٹوکنز 19,576 826
ریزننگ ٹوکنز 11,081 0

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 4.00 4.41 55.6% 2 897 1,000
Google: Gemini 2.5 Flash 1.00 10.00 0.0% 0 99 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 10.00 10.00 100.0% 0 668 763
Google: Gemini 2.5 Flash 9.88 10.00 100.0% 0 279 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 1.00 10.00 0.0% 0 16,328 7,928
Google: Gemini 2.5 Flash 4.00 7.21 55.6% 1 12 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 9.50 9.99 100.0% 0 266 468
Google: Gemini 2.5 Flash 8.00 9.99 50.0% 0 70 0
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 7.00 10.00 66.7% 0 556 593
Google: Gemini 2.5 Flash 4.67 10.00 33.3% 0 132 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Anthropic: Claude Opus 4.6 10.00 10.00 100.0% 0 861 329
Google: Gemini 2.5 Flash 10.00 10.00 100.0% 0 234 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں