नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Opus 4.7 vs Google: Gemini 2.5 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 medium रिलीज़: 2026-04-16 Gemini 2.5 Flash Gemini 2.5 Flash medium रिलीज़: 2025-06-17
स्कोर 9.2 8.2
रैंक #3 #15
संगति 10.0 9.5
सही परीक्षण
प्रति प्रयास पास दर 88.9% 75.9%
अस्थिर टेस्ट 0 1
कुल रन 54 54
प्रति परिणाम लागत 2.790 2.454
कुल लागत $0.447 $0.319
???? ??? $5.000 / 1M $0.300 / 1M
????? ??? $25.000 / 1M $2.500 / 1M
आउटपुट टोकन 5,375 1,898
रीजनिंग टोकन 1,341 122,273
प्रतिक्रिया समय (औसत) 3.53s 12.12s
प्रतिक्रिया समय (अधिकतम) 21.45s 95.48s
प्रतिक्रिया समय (कुल) 60.03s 218.12s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 348 0
Gemini 2.5 Flash 8.4 10.0 75.0% 0 6.30s 255 10,233
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 6.41s 1,141 257
Gemini 2.5 Flash 10.0 10.0 100.0% 0 16.23s 522 10,350
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 2,369 1,084
Gemini 2.5 Flash 10.0 10.0 100.0% 0 28.44s 303 11,922
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 324 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 4.06s 279 2,325
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 51 0
Gemini 2.5 Flash 5.9 7.2 55.6% 1 37.34s 18 80,702
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 256 0
Gemini 2.5 Flash 4.8 10.0 0.0% 0 4.86s 92 1,899
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 114 0
Gemini 2.5 Flash 9.8 10.0 100.0% 0 2.62s 69 1,203
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.51s 399 0
Gemini 2.5 Flash 7.7 10.0 66.7% 0 3.94s 126 2,499
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 373 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 6.20s 234 1,140

त्वरित तुलना

तुलना जोड़ी बदलें