نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Google: Gemini 3.5 Flash

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-28

میٹرک Claude Opus 4.8 Claude Opus 4.8 medium اجرا: 2026-05-28 Gemini 3.5 Flash Gemini 3.5 Flash none اجرا: 2026-05-19
اسکور 8.7 8.9
درجہ #12 #9
اعتماد پذیری 10.0 10.0
تسلسل 9.6 8.6
درست ٹیسٹس
فی کوشش کامیابی کی شرح 83.3% 90.2%
غیر مستحکم ٹیسٹ 1 3
کل رنز 60 60
فی نتیجہ لاگت 6.285 6.594
کل لاگت $1.006 $0.924
ان پٹ قیمت $5.000 / 1M $1.500 / 1M
آؤٹ پٹ قیمت $25.000 / 1M $9.000 / 1M
آؤٹ پٹ ٹوکنز 23,201 100,760
ریزننگ ٹوکنز 5,901 0
ردِعمل کا وقت (اوسط) 9.34s 9.05s
ردِعمل کا وقت (زیادہ سے زیادہ) 38.03s 64.36s
ردِعمل کا وقت (کل) 186.84s 153.86s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 1,179 478
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.53s 5,101 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 14.97s 6,651 1,381
Gemini 3.5 Flash 8.2 6.7 83.3% 1 39.62s 59,169 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 5,260 1,588
Gemini 3.5 Flash 0.0 0.0 0.0% 0 0ms 0 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 481 312
Gemini 3.5 Flash 10.0 10.0 100.0% 0 8.10s 5,895 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 7,477 900
Gemini 3.5 Flash 7.6 7.2 77.8% 1 10.64s 17,910 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 237 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.46s 1,620 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 373 320
Gemini 3.5 Flash 9.8 10.0 100.0% 0 3.38s 3,928 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 791 483
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.13s 4,640 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 301 225
Gemini 3.5 Flash 0.0 0.0 0.0% 0 0ms 0 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 451 214
Gemini 3.5 Flash 2.8 1.6 33.3% 1 4.87s 2,497 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں