نیویگیشن
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs Google: Gemini 3.1 Pro Preview

خلاصہ

Claude Opus 4.6 vs Gemini 3.1 Pro Preview benchmark موازنہ: Gemini 3.1 Pro Preview average score میں آگے ہے: 9.2 vs 7.7. Gemini 3.1 Pro Preview کی benchmark لاگت کم ہے: $1.054 vs $2.053. Gemini 3.1 Pro Preview تیز ہے: 20.14s vs 25.89s، pass rates 61.9% vs 90.5%.

تجویز کردہ ماڈل: Gemini 3.1 Pro Preview - It has the best score here (9.2), while costing about 1.9x less than Claude Opus 4.6.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-18

میٹرک Claude Opus 4.6 Claude Opus 4.6 medium اجرا: 2026-02-05 Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium اجرا: 2026-02-19
اسکور 7.7 9.2
درجہ #38 #7
اعتماد پذیری 10.0 10.0
تسلسل 8.8 10.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 61.9% 90.5%
غیر مستحکم ٹیسٹ 3 0
کل رنز 63 63
فی نتیجہ لاگت 17.103 5.546
کل لاگت $2.053 $1.054
ان پٹ قیمت $5.000 / 1M $2.000 / 1M
آؤٹ پٹ قیمت $25.000 / 1M $12.000 / 1M
کل ان پٹ ٹوکنز 53,227 41,617
آؤٹ پٹ ٹوکنز 47,446 1,977
ریزننگ ٹوکنز 24,000 78,896
ردِعمل کا وقت (اوسط) 25.89s 20.14s
ردِعمل کا وقت (زیادہ سے زیادہ) 83.40s 88.68s
ردِعمل کا وقت (کل) 362.49s 281.92s

جنریشن شوکیس

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#38 Claude Opus 4.6

medium
غلط SVG
لاگت
$0.000
وقت
300.0s
ٹوکنز
0 tok

#7 Gemini 3.1 Pro Preview

medium
لاگت
$0.115
وقت
87.2s
ٹوکنز
9,629 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 840 986 1,071
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 498 112 3,218
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 5.7 7.1 44.4% 1 30.10s 8,522 13,057 4,121
Gemini 3.1 Pro Preview 7.9 9.9 66.7% 0 40.17s 8,124 435 41,247
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 20,685 8,178 5,194
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 17,240 432 9,281
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 8,676 691 757
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 7,265 279 3,904
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 674 14,642 8,687
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 635 18 12,424
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 564 188 292
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 490 108 1,179
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 792 266 467
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 621 72 2,236
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 7.7 10.0 66.7% 0 4.71s 816 532 630
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 6.90s 570 235 3,128
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 11,454 861 329
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 6,018 274 982
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.6 3.0 10.0 0.0% 0 63.24s 204 8,045 2,452
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 6.27s 156 12 1,297

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں