नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Sonnet 5 vs Google: Gemma 4 31B

सारांश

Claude Sonnet 5 vs Gemma 4 31B benchmark तुलना: Gemma 4 31B average score में आगे है: 6.3 vs 5.7. Gemma 4 31B की benchmark लागत कम है: $0.033 vs $0.287. Claude Sonnet 5 तेज है: 4.74s vs 56.55s, pass rates 42.9% vs 69.8%.

अनुशंसित मॉडल: Gemma 4 31B - It has the best score here (6.3), while costing about 8.8x less than Claude Sonnet 5.

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-30

मेट्रिक Claude Sonnet 5 Claude Sonnet 5 none रिलीज़: 2026-06-30 Gemma 4 31B Gemma 4 31B medium रिलीज़: 2026-04-02 निःशुल्क उपलब्ध
स्कोर 5.7 6.3
रैंक #117 #90
विश्वसनीयता 10.0 10.0
संगति 8.6 9.4
सही परीक्षण
प्रति प्रयास पास दर 42.9% 69.8%
अस्थिर टेस्ट 4 1
कुल रन 63 63
प्रति परिणाम लागत 4.098 0.257
कुल लागत $0.287 $0.033
इनपुट कीमत $2.000 / 1M $0.120 / 1M
आउटपुट कीमत $10.000 / 1M $0.350 / 1M
कुल इनपुट टोकन 76,797 17,957
आउटपुट टोकन 13,325 22,356
रीजनिंग टोकन 0 65,726
प्रतिक्रिया समय (औसत) 4.74s 56.55s
प्रतिक्रिया समय (अधिकतम) 29.46s 437.40s
प्रतिक्रिया समय (कुल) 99.46s 1074.41s

जनरेशन शोकेस

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 Claude Sonnet 5

none
लागत
$0.061
समय
53.7s
टोकन
6,172 tok

#90 Gemma 4 31B

medium
लागत
$0.002
समय
45.7s
टोकन
2,696 tok

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 5.3 10.0 25.0% 0 3.60s 834 1,813 0
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 816 962 2,046
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 4.6 7.9 22.2% 1 3.67s 10,590 1,864 0
Gemma 4 31B 4.3 5.8 22.2% 1 219.76s 5,568 11,098 33,212
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 3.0 10.0 0.0% 0 29.46s 38,775 6,340 0
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 10.0 10.0 100.0% 0 3.01s 10,503 309 0
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 8,334 1,822 2,951
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 5.3 7.2 44.4% 1 3.28s 975 933 0
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 876 4,349 8,985
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 4.7 3.1 33.3% 1 2.81s 708 272 0
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 567 105 888
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 6.4 10.0 50.0% 0 2.58s 909 103 0
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 777 533 2,035
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 6.0 7.4 55.6% 1 3.22s 894 778 0
Gemma 4 31B 9.9 10.0 100.0% 0 26.91s 801 1,795 5,595
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 10.0 10.0 100.0% 0 6.80s 12,351 522 0
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) इनपुट टोकन आउटपुट टोकन रीजनिंग टोकन
Claude Sonnet 5 3.0 10.0 0.0% 0 4.31s 258 391 0
Gemma 4 31B 3.0 10.0 0.0% 0 90.14s 218 1,692 10,014

त्वरित तुलना

तुलना जोड़ी बदलें