نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Google: Gemini 3.5 Flash

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-28

میٹرک Claude Opus 4.8 Claude Opus 4.8 none اجرا: 2026-05-28 Gemini 3.5 Flash Gemini 3.5 Flash high اجرا: 2026-05-19
اسکور 7.3 9.6
درجہ #63 #2
اعتماد پذیری 10.0 10.0
تسلسل 9.2 9.6
درست ٹیسٹس
فی کوشش کامیابی کی شرح 65.0% 96.7%
غیر مستحکم ٹیسٹ 2 1
کل رنز 60 60
فی نتیجہ لاگت 4.324 5.231
کل لاگت $0.519 $0.994
ان پٹ قیمت $5.000 / 1M $1.500 / 1M
آؤٹ پٹ قیمت $25.000 / 1M $9.000 / 1M
آؤٹ پٹ ٹوکنز 8,098 1,969
ریزننگ ٹوکنز 0 102,679
ردِعمل کا وقت (اوسط) 3.51s 8.30s
ردِعمل کا وقت (زیادہ سے زیادہ) 17.73s 34.82s
ردِعمل کا وقت (کل) 70.19s 165.92s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.57s 174 4,997
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 24.62s 450 34,170
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.37s 351 16,323
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.43s 279 8,466
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
Gemini 3.5 Flash 7.6 7.2 77.8% 1 14.09s 12 24,721
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.63s 115 1,650
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.35s 70 3,799
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.23s 241 4,940
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
Gemini 3.5 Flash 9.8 10.0 100.0% 0 4.96s 265 1,608
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.94s 12 2,005

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں