नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Google: Gemma 4 31B vs OpenAI: GPT-5.2

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-02

मेट्रिक Gemma 4 31B Gemma 4 31B none रिलीज़: 2026-04-02 GPT-5.2 GPT-5.2 medium रिलीज़: 2025-12-11
स्कोर 6.7 7.3
रैंक #47 #36
संगति 10.0 8.0
सही परीक्षण
प्रति प्रयास पास दर 52.9% 70.6%
अस्थिर टेस्ट 0 4
कुल रन 51 51
प्रति परिणाम लागत 0.023 3.131
कुल लागत $0.002 $0.314
???? ??? $0.140 / 1M $1.750 / 1M
????? ??? $0.400 / 1M $14.000 / 1M
आउटपुट टोकन 660 2,238
रीजनिंग टोकन 0 16,811
प्रतिक्रिया समय (औसत) 2.55s 13.93s
प्रतिक्रिया समय (अधिकतम) 4.68s 77.80s
प्रतिक्रिया समय (कुल) 38.20s 139.29s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 6.5 10.0 50.0% 0 1.85s 45 0
GPT-5.2 6.5 8.0 58.3% 1 7.81s 567 2,002
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
GPT-5.2 10.0 10.0 100.0% 0 14.06s 291 1,757
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 2.25s 285 0
GPT-5.2 10.0 10.0 100.0% 0 3.15s 234 420
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 7.7 10.0 66.7% 0 3.22s 27 0
GPT-5.2 5.9 7.2 55.6% 1 77.80s 42 10,342
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 10.0 10.0 100.0% 0 2.09s 117 0
GPT-5.2 3.7 9.7 0.0% 0 4.32s 162 269
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 6.5 10.0 50.0% 0 2.84s 78 0
GPT-5.2 9.9 10.0 100.0% 0 3.12s 94 614
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 5.5 10.0 33.3% 0 2.95s 108 0
GPT-5.2 7.7 7.3 77.8% 1 5.47s 609 938
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
GPT-5.2 4.7 1.6 66.7% 1 10.30s 239 469

त्वरित तुलना

तुलना जोड़ी बदलें