नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Anthropic: Claude Opus 4.6 vs Google: Gemini 3 Flash Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-24

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium रिलीज़: 2026-02-05 Gemini 3 Flash Preview Gemini 3 Flash Preview none रिलीज़: 2025-12-17
स्कोर 7.6 8.1
रैंक #45 #25
विश्वसनीयता लागू नहीं लागू नहीं
संगति 9.1 9.1
सही परीक्षण
प्रति प्रयास पास दर 70.4% 77.8%
अस्थिर टेस्ट 2 2
कुल रन 54 54
प्रति परिणाम लागत 12.047 0.156
कुल लागत $1.446 $0.021
???? ??? $5.000 / 1M $0.500 / 1M
????? ??? $25.000 / 1M $3.000 / 1M
आउटपुट टोकन 29,829 1,840
रीजनिंग टोकन 18,938 0
प्रतिक्रिया समय (औसत) 21.08s 1.65s
प्रतिक्रिया समय (अधिकतम) 83.40s 3.56s
प्रतिक्रिया समय (कुल) 231.84s 18.20s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
Gemini 3 Flash Preview 8.3 10.0 75.0% 0 1.25s 214 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 23.11s 3,486 1,504
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 1.59s 423 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
Gemini 3 Flash Preview 4.7 1.6 66.7% 1 3.56s 350 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 1.41s 279 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
Gemini 3 Flash Preview 7.7 10.0 66.7% 0 963ms 18 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 1.13s 104 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
Gemini 3 Flash Preview 6.4 5.8 66.7% 1 1.58s 74 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
Gemini 3 Flash Preview 7.7 10.0 66.7% 0 1.06s 144 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
Gemini 3 Flash Preview 10.0 10.0 100.0% 0 3.35s 234 0

त्वरित तुलना

तुलना जोड़ी बदलें