नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Sonnet 4.6 vs Google: Gemini 3.5 Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-19

मेट्रिक Claude Sonnet 4.6 Claude Sonnet 4.6 none रिलीज़: 2026-02-17 Gemini 3.5 Flash Gemini 3.5 Flash medium रिलीज़: 2026-05-19
स्कोर 7.2 9.2
रैंक #68 #5
विश्वसनीयता 10.0 10.0
संगति 9.6 10.0
सही परीक्षण
प्रति प्रयास पास दर 61.4% 89.5%
अस्थिर टेस्ट 1 0
कुल रन 57 57
प्रति परिणाम लागत 2.441 2.307
कुल लागत $0.269 $0.393
???? ??? $3.000 / 1M $1.500 / 1M
????? ??? $15.000 / 1M $9.000 / 1M
आउटपुट टोकन 7,864 1,971
रीजनिंग टोकन 0 36,659
प्रतिक्रिया समय (औसत) 4.96s 3.90s
प्रतिक्रिया समय (अधिकतम) 23.84s 12.05s
प्रतिक्रिया समय (कुल) 59.50s 74.13s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 4.8 10.0 25.0% 0 2.94s 1,214 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.09s 171 3,385
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.67s 523 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 8.22s 431 5,190
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 9.5 10.0 100.0% 0 23.84s 3,766 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 12.05s 351 7,807
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 3.43s 252 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 4.07s 279 3,784
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 3.54s 413 0
Gemini 3.5 Flash 7.7 10.0 66.7% 0 5.24s 12 8,047
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.1 3.1 66.7% 1 2.56s 192 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.52s 115 1,144
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 6.5 10.0 50.0% 0 1.96s 90 0
Gemini 3.5 Flash 9.9 10.0 100.0% 0 2.70s 71 2,855
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 7.7 10.0 66.7% 0 2.92s 536 0
Gemini 3.5 Flash 7.7 10.0 66.7% 0 2.38s 295 2,747
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.11s 447 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.81s 234 455
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 4.6 3.0 10.0 0.0% 0 4.67s 431 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.75s 12 1,245

त्वरित तुलना

तुलना जोड़ी बदलें