नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Opus 4.8 vs Google: Gemini 3.5 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-28

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 medium रिलीज़: 2026-05-28 Gemini 3.5 Flash Gemini 3.5 Flash high रिलीज़: 2026-05-19
स्कोर 8.7 9.6
रैंक #12 #2
विश्वसनीयता 10.0 10.0
संगति 9.6 9.6
सही परीक्षण
प्रति प्रयास पास दर 83.3% 96.7%
अस्थिर टेस्ट 1 1
कुल रन 60 60
प्रति परिणाम लागत 6.285 5.231
कुल लागत $1.006 $0.994
इनपुट कीमत $5.000 / 1M $1.500 / 1M
आउटपुट कीमत $25.000 / 1M $9.000 / 1M
आउटपुट टोकन 23,201 1,969
रीजनिंग टोकन 5,901 102,679
प्रतिक्रिया समय (औसत) 9.34s 8.30s
प्रतिक्रिया समय (अधिकतम) 38.03s 34.82s
प्रतिक्रिया समय (कुल) 186.84s 165.92s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 1,179 478
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.57s 174 4,997
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 14.97s 6,651 1,381
Gemini 3.5 Flash 10.0 10.0 100.0% 0 24.62s 450 34,170
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 5,260 1,588
Gemini 3.5 Flash 10.0 10.0 100.0% 0 22.37s 351 16,323
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 481 312
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.43s 279 8,466
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 7,477 900
Gemini 3.5 Flash 7.6 7.2 77.8% 1 14.09s 12 24,721
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 237 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.63s 115 1,650
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 373 320
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.35s 70 3,799
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 791 483
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.23s 241 4,940
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 301 225
Gemini 3.5 Flash 9.8 10.0 100.0% 0 4.96s 265 1,608
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 451 214
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.94s 12 2,005

त्वरित तुलना

तुलना जोड़ी बदलें