नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Opus 4.7 vs Google: Gemini 3 Flash Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-29

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 none रिलीज़: 2026-04-16 Gemini 3 Flash Preview Gemini 3 Flash Preview medium रिलीज़: 2025-12-17
स्कोर 8.9 9.8
रैंक #10 #1
विश्वसनीयता 10.0 10.0
संगति 10.0 9.6
सही परीक्षण
प्रति प्रयास पास दर 84.2% 98.3%
अस्थिर टेस्ट 0 1
कुल रन 57 60
प्रति परिणाम लागत 3.154 2.980
कुल लागत $0.505 $0.567
इनपुट कीमत $5.000 / 1M $0.500 / 1M
आउटपुट कीमत $25.000 / 1M $3.000 / 1M
आउटपुट टोकन 6,265 2,000
रीजनिंग टोकन 0 181,033
प्रतिक्रिया समय (औसत) 3.02s 16.50s
प्रतिक्रिया समय (अधिकतम) 18.27s 117.26s
प्रतिक्रिया समय (कुल) 57.44s 330.06s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 8.3 10.0 75.0% 0 2.12s 522 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.88s 330 3,216
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.84s 494 0
Gemini 3 Flash Preview 7.9 6.4 83.3% 1 95.96s 456 127,964
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 9.5 10.0 100.0% 0 18.27s 3,504 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 22.42s 351 10,485
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.15s 324 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.43s 279 4,893
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 7.7 10.0 66.7% 0 1.19s 78 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 15.27s 12 21,684
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 3.47s 257 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.19s 72 1,905
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 1.46s 114 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.04s 72 2,709
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.46s 597 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.05s 183 4,365
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 4.74s 372 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 12.60s 234 1,487
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 3.0 10.0 0.0% 0 1.46s 3 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 5.50s 11 2,325

त्वरित तुलना

तुलना जोड़ी बदलें