नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Opus 4.8 vs Google: Gemini 2.5 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-01

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 none रिलीज़: 2026-05-28 Gemini 2.5 Flash Gemini 2.5 Flash medium रिलीज़: 2025-06-17
स्कोर 7.3 7.7
रैंक #66 #40
विश्वसनीयता 10.0 10.0
संगति 9.2 9.6
सही परीक्षण
प्रति प्रयास पास दर 65.0% 68.3%
अस्थिर टेस्ट 2 1
कुल रन 60 60
प्रति परिणाम लागत 4.324 2.750
कुल लागत $0.519 $0.358
इनपुट कीमत $5.000 / 1M $0.300 / 1M
आउटपुट कीमत $25.000 / 1M $2.500 / 1M
आउटपुट टोकन 8,098 1,924
रीजनिंग टोकन 0 137,255
प्रतिक्रिया समय (औसत) 3.51s 15.57s
प्रतिक्रिया समय (अधिकतम) 17.73s 95.48s
प्रतिक्रिया समय (कुल) 70.19s 311.47s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
Gemini 2.5 Flash 8.4 10.0 75.0% 0 6.30s 255 10,233
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
Gemini 2.5 Flash 6.6 10.0 50.0% 0 54.56s 537 24,413
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 28.44s 303 11,922
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 4.06s 279 2,325
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
Gemini 2.5 Flash 5.9 7.2 55.6% 1 37.34s 18 80,702
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
Gemini 2.5 Flash 4.8 10.0 0.0% 0 4.86s 92 1,899
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
Gemini 2.5 Flash 9.8 10.0 100.0% 0 2.62s 69 1,203
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
Gemini 2.5 Flash 7.7 10.0 66.7% 0 3.18s 126 2,499
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 6.20s 234 1,140
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
Gemini 2.5 Flash 3.0 10.0 0.0% 0 2.76s 11 919

त्वरित तुलना

तुलना जोड़ी बदलें