नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Opus 4.8 vs Google: Gemini 3.5 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-28

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 medium रिलीज़: 2026-05-28 Gemini 3.5 Flash Gemini 3.5 Flash none रिलीज़: 2026-05-19
स्कोर 8.7 8.9
रैंक #12 #9
विश्वसनीयता 10.0 10.0
संगति 9.6 8.6
सही परीक्षण
प्रति प्रयास पास दर 83.3% 90.2%
अस्थिर टेस्ट 1 3
कुल रन 60 60
प्रति परिणाम लागत 6.285 6.594
कुल लागत $1.006 $0.924
इनपुट कीमत $5.000 / 1M $1.500 / 1M
आउटपुट कीमत $25.000 / 1M $9.000 / 1M
आउटपुट टोकन 23,201 100,760
रीजनिंग टोकन 5,901 0
प्रतिक्रिया समय (औसत) 9.34s 9.05s
प्रतिक्रिया समय (अधिकतम) 38.03s 64.36s
प्रतिक्रिया समय (कुल) 186.84s 153.86s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 1,179 478
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.53s 5,101 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 14.97s 6,651 1,381
Gemini 3.5 Flash 8.2 6.7 83.3% 1 39.62s 59,169 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 5,260 1,588
Gemini 3.5 Flash 0.0 0.0 0.0% 0 0ms 0 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 481 312
Gemini 3.5 Flash 10.0 10.0 100.0% 0 8.10s 5,895 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 7,477 900
Gemini 3.5 Flash 7.6 7.2 77.8% 1 10.64s 17,910 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 237 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.46s 1,620 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 373 320
Gemini 3.5 Flash 9.8 10.0 100.0% 0 3.38s 3,928 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 791 483
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.13s 4,640 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 301 225
Gemini 3.5 Flash 0.0 0.0 0.0% 0 0ms 0 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 451 214
Gemini 3.5 Flash 2.8 1.6 33.3% 1 4.87s 2,497 0

त्वरित तुलना

तुलना जोड़ी बदलें