नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Anthropic: Claude Sonnet 5 vs Google: Gemini 3.5 Flash

सारांश

Claude Sonnet 5 vs Gemini 3.5 Flash benchmark तुलना: Claude Sonnet 5 average score में आगे है: 7.9 vs 7.0. Claude Sonnet 5 की benchmark लागत कम है: $0.550 vs $1.079. Gemini 3.5 Flash तेज है: 9.93s vs 9.94s, pass rates 79.4% vs 77.8%.

अनुशंसित मॉडल: Claude Sonnet 5 - It has the best score here (7.9), while costing about 2.0x less than Gemini 3.5 Flash.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-30

मेट्रिक Claude Sonnet 5 Claude Sonnet 5 medium रिलीज़: 2026-06-30 Gemini 3.5 Flash Gemini 3.5 Flash none रिलीज़: 2026-05-19
स्कोर 7.9 7.0
रैंक #30 #68
विश्वसनीयता 10.0 10.0
संगति 9.0 8.9
सही परीक्षण
प्रति प्रयास पास दर 79.4% 77.8%
अस्थिर टेस्ट 3 3
कुल रन 63 63
प्रति परिणाम लागत 3.662 7.190
कुल लागत $0.550 $1.079
इनपुट कीमत $2.000 / 1M $1.500 / 1M
आउटपुट कीमत $10.000 / 1M $9.000 / 1M
कुल इनपुट टोकन 67,416 13,843
आउटपुट टोकन 34,012 117,518
रीजनिंग टोकन 7,673 0
प्रतिक्रिया समय (औसत) 9.94s 9.93s
प्रतिक्रिया समय (अधिकतम) 56.94s 64.36s
प्रतिक्रिया समय (कुल) 208.71s 178.68s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#30 Claude Sonnet 5

medium
लागत
$0.007
समय
6.4s
टोकन
832 tok

#68 Gemini 3.5 Flash

none
लागत
$0.225
समय
125.5s
टोकन
25,004 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 10.0 10.0 100.0% 0 3.80s 834 1,220 446
Gemini 3.5 Flash 10.0 10.0 100.0% 0 2.53s 492 5,101 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 9.0 7.9 88.9% 1 17.28s 10,590 13,153 2,379
Gemini 3.5 Flash 8.8 7.8 88.9% 1 34.69s 8,122 75,927 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 4.5 2.1 66.7% 1 37.01s 29,394 4,848 2,170
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 10.0 10.0 100.0% 0 3.16s 10,503 312 0
Gemini 3.5 Flash 6.5 10.0 50.0% 0 8.10s 2,781 5,895 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 7.7 10.0 66.7% 0 20.38s 975 12,140 1,994
Gemini 3.5 Flash 7.6 7.2 77.8% 1 10.64s 633 17,910 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 4.8 3.2 33.3% 1 4.32s 708 264 0
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.46s 486 1,620 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 9.9 10.0 100.0% 0 3.10s 909 318 269
Gemini 3.5 Flash 9.8 10.0 100.0% 0 3.38s 615 3,928 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 7.7 10.0 66.7% 0 2.98s 894 407 121
Gemini 3.5 Flash 10.0 10.0 100.0% 0 3.13s 558 4,640 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 10.0 10.0 100.0% 0 10.70s 12,351 433 90
Gemini 3.5 Flash 3.0 10.0 0.0% 0 0ms 0 0 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 3.0 10.0 0.0% 0 7.06s 258 917 204
Gemini 3.5 Flash 2.8 1.6 33.3% 1 4.87s 156 2,497 0

त्वरित तुलना

तुलना जोड़ी बदलें