नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Anthropic: Claude Opus 4.7 vs Google: Gemini 2.5 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 none रिलीज़: 2026-04-16 Gemini 2.5 Flash Gemini 2.5 Flash medium रिलीज़: 2025-06-17
स्कोर 9.2 8.2
रैंक #4 #15
संगति 10.0 9.5
सही परीक्षण
प्रति प्रयास पास दर 88.9% 75.9%
अस्थिर टेस्ट 0 1
कुल रन 54 54
प्रति परिणाम लागत 3.155 2.454
कुल लागत $0.505 $0.319
???? ??? $5.000 / 1M $0.300 / 1M
????? ??? $25.000 / 1M $2.500 / 1M
आउटपुट टोकन 6,326 1,898
रीजनिंग टोकन 0 122,273
प्रतिक्रिया समय (औसत) 3.13s 12.12s
प्रतिक्रिया समय (अधिकतम) 18.27s 95.48s
प्रतिक्रिया समय (कुल) 56.33s 218.12s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 8.3 10.0 75.0% 0 2.12s 522 0
Gemini 2.5 Flash 8.4 10.0 75.0% 0 6.30s 255 10,233
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.84s 494 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 16.23s 522 10,350
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 9.5 10.0 100.0% 0 18.27s 3,504 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 28.44s 303 11,922
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.15s 324 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 4.06s 279 2,325
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 7.7 10.0 66.7% 0 1.19s 78 0
Gemini 2.5 Flash 5.9 7.2 55.6% 1 37.34s 18 80,702
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 3.47s 257 0
Gemini 2.5 Flash 4.8 10.0 0.0% 0 4.86s 92 1,899
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 1.46s 114 0
Gemini 2.5 Flash 9.8 10.0 100.0% 0 2.62s 69 1,203
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.58s 661 0
Gemini 2.5 Flash 7.7 10.0 66.7% 0 3.94s 126 2,499
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 4.74s 372 0
Gemini 2.5 Flash 10.0 10.0 100.0% 0 6.20s 234 1,140

त्वरित तुलना

तुलना जोड़ी बदलें