नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Google: Gemma 4 31B vs OpenAI: GPT-5.4

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-02

मेट्रिक Gemma 4 31B Gemma 4 31B medium रिलीज़: 2026-04-02 GPT-5.4 GPT-5.4 medium रिलीज़: 2026-03-05
स्कोर 8.6 8.1
रैंक #5 #18
संगति 9.6 8.6
सही परीक्षण
प्रति प्रयास पास दर 80.4% 78.4%
अस्थिर टेस्ट 1 3
कुल रन 51 51
प्रति परिणाम लागत 0.109 6.613
कुल लागत $0.015 $0.794
???? ??? $0.140 / 1M $2.500 / 1M
????? ??? $0.400 / 1M $15.000 / 1M
आउटपुट टोकन 9,568 1,780
रीजनिंग टोकन 22,501 46,687
प्रतिक्रिया समय (औसत) 21.81s 18.95s
प्रतिक्रिया समय (अधिकतम) 68.92s 100.41s
प्रतिक्रिया समय (कुल) 327.16s 322.23s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 962 2,046
GPT-5.4 8.3 10.0 75.0% 0 4.11s 240 1,511
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 1,822 2,951
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 4,349 8,985
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 105 888
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 533 2,035
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 8.8 7.9 88.9% 1 27.63s 1,797 5,596
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031

त्वरित तुलना

तुलना जोड़ी बदलें