नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Opus 4.8 vs Google: Gemini 3.1 Pro Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-28

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 medium रिलीज़: 2026-05-28 Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium रिलीज़: 2026-02-19
स्कोर 8.7 9.3
रैंक #12 #4
विश्वसनीयता 10.0 10.0
संगति 9.6 10.0
सही परीक्षण
प्रति प्रयास पास दर 83.3% 90.0%
अस्थिर टेस्ट 1 0
कुल रन 60 60
प्रति परिणाम लागत 6.285 5.587
कुल लागत $1.006 $1.006
इनपुट कीमत $5.000 / 1M $2.000 / 1M
आउटपुट कीमत $25.000 / 1M $12.000 / 1M
आउटपुट टोकन 23,201 1,971
रीजनिंग टोकन 5,901 75,384
प्रतिक्रिया समय (औसत) 9.34s 20.77s
प्रतिक्रिया समय (अधिकतम) 38.03s 88.68s
प्रतिक्रिया समय (कुल) 186.84s 269.96s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 1,179 478
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 14.97s 6,651 1,381
Gemini 3.1 Pro Preview 7.0 9.8 50.0% 0 54.28s 429 37,735
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 5,260 1,588
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 481 312
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 7,477 900
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 237 0
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 373 320
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 791 483
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 6.90s 235 3,128
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 301 225
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 451 214
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 6.27s 12 1,297

त्वरित तुलना

तुलना जोड़ी बदलें