नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Anthropic: Claude Opus 4.7 vs Google: Gemma 4 31B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-16

मेट्रिक Claude Opus 4.7 Claude Opus 4.7 medium रिलीज़: 2026-04-16 Gemma 4 31B Gemma 4 31B none रिलीज़: 2026-04-02 निःशुल्क उपलब्ध
स्कोर 9.2 6.9
रैंक #3 #47
संगति 10.0 10.0
सही परीक्षण
प्रति प्रयास पास दर 88.9% 55.6%
अस्थिर टेस्ट 0 0
कुल रन 54 54
प्रति परिणाम लागत 2.790 0.024
कुल लागत $0.447 $0.003
???? ??? $5.000 / 1M $0.130 / 1M
????? ??? $25.000 / 1M $0.380 / 1M
आउटपुट टोकन 5,375 1,359
रीजनिंग टोकन 1,341 0
प्रतिक्रिया समय (औसत) 3.53s 4.02s
प्रतिक्रिया समय (अधिकतम) 21.45s 26.13s
प्रतिक्रिया समय (कुल) 60.03s 64.33s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 8.3 10.0 75.0% 0 1.85s 348 0
Gemma 4 31B 6.5 10.0 50.0% 0 1.85s 45 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 6.41s 1,141 257
Gemma 4 31B 10.0 10.0 100.0% 0 26.13s 699 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 21.45s 2,369 1,084
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.37s 324 0
Gemma 4 31B 10.0 10.0 100.0% 0 2.25s 285 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 7.7 10.0 66.7% 0 1.17s 51 0
Gemma 4 31B 7.7 10.0 66.7% 0 3.22s 27 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.87s 256 0
Gemma 4 31B 10.0 10.0 100.0% 0 2.09s 117 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 1.57s 114 0
Gemma 4 31B 6.5 10.0 50.0% 0 2.84s 78 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 2.51s 399 0
Gemma 4 31B 5.5 10.0 33.3% 0 2.95s 108 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.7 10.0 10.0 100.0% 0 4.17s 373 0
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0

त्वरित तुलना

तुलना जोड़ी बदलें