नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Google: Gemma 4 31B vs OpenAI: GPT-5.4 Mini

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-02

मेट्रिक Gemma 4 31B Gemma 4 31B none रिलीज़: 2026-04-02 GPT-5.4 Mini GPT-5.4 Mini medium रिलीज़: 2026-03-17
स्कोर 6.7 7.1
रैंक #47 #41
संगति 10.0 7.2
सही परीक्षण
प्रति प्रयास पास दर 52.9% 68.6%
अस्थिर टेस्ट 0 6
कुल रन 51 51
प्रति परिणाम लागत 0.023 3.610
कुल लागत $0.002 $0.289
???? ??? $0.140 / 1M $0.750 / 1M
????? ??? $0.400 / 1M $4.500 / 1M
आउटपुट टोकन 660 1,708
रीजनिंग टोकन 0 58,019
प्रतिक्रिया समय (औसत) 2.55s 15.66s
प्रतिक्रिया समय (अधिकतम) 4.68s 102.91s
प्रतिक्रिया समय (कुल) 38.20s 266.14s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 6.5 10.0 50.0% 0 1.85s 45 0
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 296 2,876
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 317 4,317
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 2.25s 285 0
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 234 650
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 7.7 10.0 66.7% 0 3.22s 27 0
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 60 43,286
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 2.09s 117 0
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 150 510
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 6.5 10.0 50.0% 0 2.84s 78 0
GPT-5.4 Mini 7.4 6.5 66.7% 1 2.50s 129 1,337
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 5.5 10.0 33.3% 0 2.95s 108 0
GPT-5.4 Mini 6.8 7.9 55.6% 1 4.33s 271 2,449
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 251 2,594

त्वरित तुलना

तुलना जोड़ी बदलें