नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Opus 4.8 vs Google: Gemini 3.5 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-28

मेट्रिक Claude Opus 4.8 Claude Opus 4.8 medium रिलीज़: 2026-05-28 Gemini 3.5 Flash Gemini 3.5 Flash low रिलीज़: 2026-05-19
स्कोर 8.7 9.3
रैंक #12 #3
विश्वसनीयता 10.0 10.0
संगति 9.6 10.0
सही परीक्षण
प्रति प्रयास पास दर 83.3% 90.0%
अस्थिर टेस्ट 1 0
कुल रन 60 60
प्रति परिणाम लागत 6.285 1.582
कुल लागत $1.006 $0.285
इनपुट कीमत $5.000 / 1M $1.500 / 1M
आउटपुट कीमत $25.000 / 1M $9.000 / 1M
आउटपुट टोकन 23,201 2,027
रीजनिंग टोकन 5,901 23,938
प्रतिक्रिया समय (औसत) 9.34s 2.98s
प्रतिक्रिया समय (अधिकतम) 38.03s 6.44s
प्रतिक्रिया समय (कुल) 186.84s 59.59s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 1,179 478
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.52s 209 2,536
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 14.97s 6,651 1,381
Gemini 3.5 Flash 6.8 10.0 50.0% 0 5.54s 452 6,839
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 9.8 10.0 100.0% 0 38.03s 5,260 1,588
Gemini 3.5 Flash 10.0 10.0 100.0% 0 6.44s 351 3,050
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 7.1 5.6 83.3% 1 12.29s 481 312
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.81s 279 1,164
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 5.3 10.0 33.3% 0 14.15s 7,477 900
Gemini 3.5 Flash 7.7 10.0 66.7% 0 3.39s 12 4,538
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 2.46s 237 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.27s 119 916
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.32s 373 320
Gemini 3.5 Flash 9.9 10.0 100.0% 0 1.86s 71 1,652
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 3.95s 791 483
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.35s 288 2,150
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 10.0 10.0 100.0% 0 8.96s 301 225
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.27s 234 403
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.8 3.0 10.0 0.0% 0 6.14s 451 214
Gemini 3.5 Flash 10.0 10.0 100.0% 0 1.88s 12 690

त्वरित तुलना

तुलना जोड़ी बदलें