نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs Google: Gemini 3.1 Pro Preview

خلاصہ

Claude Opus 4.8 vs Gemini 3.1 Pro Preview benchmark موازنہ: Gemini 3.1 Pro Preview average score میں آگے ہے: 9.2 vs 7.7. Gemini 3.1 Pro Preview کی benchmark لاگت کم ہے: $1.054 vs $1.270. Claude Opus 4.8 تیز ہے: 10.83s vs 20.14s، pass rates 79.4% vs 90.5%.

تجویز کردہ ماڈل: Gemini 3.1 Pro Preview - It has the strongest score in this comparison (9.2) and the best overall balance of cost and response time across all 2 models.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-07-02

میٹرک Claude Opus 4.8 Claude Opus 4.8 low اجرا: 2026-05-28 Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium اجرا: 2026-02-19
اسکور 7.7 9.2
درجہ #38 #7
اعتماد پذیری 10.0 10.0
تسلسل 8.8 10.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 79.4% 90.5%
غیر مستحکم ٹیسٹ 3 0
کل رنز 63 63
فی نتیجہ لاگت 8.466 5.546
کل لاگت $1.270 $1.054
ان پٹ قیمت $5.000 / 1M $2.000 / 1M
آؤٹ پٹ قیمت $25.000 / 1M $12.000 / 1M
کل ان پٹ ٹوکنز 60,946 41,617
آؤٹ پٹ ٹوکنز 31,771 1,977
ریزننگ ٹوکنز 6,831 78,896
ردِعمل کا وقت (اوسط) 10.83s 20.14s
ردِعمل کا وقت (زیادہ سے زیادہ) 127.97s 88.68s
ردِعمل کا وقت (کل) 227.39s 281.92s

جنریشن شوکیس

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#38 Claude Opus 4.8

low
لاگت
$0.031
وقت
14.1s
ٹوکنز
1,345 tok

#7 Gemini 3.1 Pro Preview

medium
لاگت
$0.115
وقت
87.2s
ٹوکنز
9,629 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.30s 834 793 371
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 498 112 3,218
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 6.6 4.6 77.8% 2 7.58s 10,590 3,637 809
Gemini 3.1 Pro Preview 7.9 9.9 66.7% 0 40.17s 8,124 435 41,247
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 9.8 10.0 100.0% 0 20.84s 23,500 2,216 1,081
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 17,240 432 9,281
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 6.3 5.8 66.7% 1 2.27s 10,503 310 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 7,265 279 3,904
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 5.3 10.0 33.3% 0 45.53s 975 23,311 3,908
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 635 18 12,424
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 2.55s 708 231 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 490 108 1,179
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 9.8 10.0 100.0% 0 2.78s 909 111 221
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 621 72 2,236
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 3.01s 894 592 184
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 6.90s 570 235 3,128
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 10.0 10.0 100.0% 0 6.85s 11,775 370 35
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 6,018 274 982
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.8 3.0 10.0 0.0% 0 5.48s 258 200 222
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 6.27s 156 12 1,297

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں