नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Anthropic: Claude Opus 4.7 vs Google: Gemini 3 Flash Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 none रिलीज़: 2026-04-16 Gemini 3 Flash Preview Gemini 3 Flash Preview medium रिलीज़: 2025-12-17
स्कोर 9.2 10.0
रैंक #4 #1
संगति 10.0 10.0
सही परीक्षण
प्रति प्रयास पास दर 88.9% 100.0%
अस्थिर टेस्ट 0 0
कुल रन 54 54
प्रति परिणाम लागत 3.155 1.740
कुल लागत $0.505 $0.314
???? ??? $5.000 / 1M $0.500 / 1M
????? ??? $25.000 / 1M $3.000 / 1M
आउटपुट टोकन 6,326 2,072
रीजनिंग टोकन 0 97,041
प्रतिक्रिया समय (औसत) 3.13s 17.60s
प्रतिक्रिया समय (अधिकतम) 18.27s 79.71s
प्रतिक्रिया समय (कुल) 56.33s 193.57s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 8.3 10.0 75.0% 0 2.12s 522 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.13s 305 3,490
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.84s 494 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 79.71s 432 48,771
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 9.5 10.0 100.0% 0 18.27s 3,504 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 50.16s 351 12,645
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.15s 324 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.72s 279 5,333
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 7.7 10.0 66.7% 0 1.19s 78 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 21.12s 12 14,908
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 3.47s 257 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.09s 111 1,285
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 1.46s 114 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 6.10s 72 4,558
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.58s 661 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 4.43s 276 4,921
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 4.74s 372 0
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 10.55s 234 1,130

त्वरित तुलना

तुलना जोड़ी बदलें