नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Anthropic: Claude Opus 4.6 vs Google: Gemma 4 31B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-04

मेट्रिक Claude Opus 4.6 Claude Opus 4.6 medium रिलीज़: 2026-02-05 Gemma 4 31B Gemma 4 31B none रिलीज़: 2026-04-02
स्कोर 7.5 6.7
रैंक #34 #48
संगति 9.0 10.0
सही परीक्षण
प्रति प्रयास पास दर 68.6% 52.9%
अस्थिर टेस्ट 2 0
कुल रन 51 51
प्रति परिणाम लागत 11.973 0.023
कुल लागत $1.317 $0.002
???? ??? $5.000 / 1M $0.140 / 1M
????? ??? $25.000 / 1M $0.400 / 1M
आउटपुट टोकन 26,343 660
रीजनिंग टोकन 17,434 0
प्रतिक्रिया समय (औसत) 20.87s 2.55s
प्रतिक्रिया समय (अधिकतम) 83.40s 4.68s
प्रतिक्रिया समय (कुल) 208.73s 38.20s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
Gemma 4 31B 6.5 10.0 50.0% 0 1.85s 45 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
Gemma 4 31B 10.0 10.0 100.0% 0 2.25s 285 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
Gemma 4 31B 7.7 10.0 66.7% 0 3.22s 27 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
Gemma 4 31B 10.0 10.0 100.0% 0 2.09s 117 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
Gemma 4 31B 6.5 10.0 50.0% 0 2.84s 78 0
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 7.7 10.0 66.7% 0 4.60s 531 637
Gemma 4 31B 5.5 10.0 33.3% 0 2.95s 108 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0

त्वरित तुलना

तुलना जोड़ी बदलें