नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemma 4 31B vs OpenAI: GPT-5.4

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-02

मेट्रिक Gemma 4 31B Gemma 4 31B medium प्रकाशन: 2026-04-02 GPT-5.4 GPT-5.4 medium प्रकाशन: 2026-03-05
स्कोअर 8.6 8.1
क्रमांक #5 #18
सुसंगतता 9.6 8.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 80.4% 78.4%
अस्थिर चाचण्या 1 3
एकूण रन 51 51
प्रति निकाल खर्च 0.109 6.613
एकूण खर्च $0.015 $0.794
???? ??? $0.140 / 1M $2.500 / 1M
????? ??? $0.400 / 1M $15.000 / 1M
आउटपुट टोकन्स 9,568 1,780
रिझनिंग टोकन्स 22,501 46,687
प्रतिसाद वेळ (सरासरी) 21.81s 18.95s
प्रतिसाद वेळ (कमाल) 68.92s 100.41s
प्रतिसाद वेळ (एकूण) 327.16s 322.23s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 962 2,046
GPT-5.4 8.3 10.0 75.0% 0 4.11s 240 1,511
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
GPT-5.4 10.0 10.0 100.0% 0 20.57s 301 3,543
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 1,822 2,951
GPT-5.4 10.0 10.0 100.0% 0 5.32s 234 804
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 4,349 8,985
GPT-5.4 5.3 7.2 44.4% 1 74.27s 61 34,748
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 105 888
GPT-5.4 4.7 3.1 33.3% 1 4.92s 145 321
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 533 2,035
GPT-5.4 10.0 10.0 100.0% 0 3.11s 93 897
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 8.8 7.9 88.9% 1 27.63s 1,797 5,596
GPT-5.4 8.2 7.2 88.9% 1 9.13s 442 3,832
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
GPT-5.4 10.0 10.0 100.0% 0 13.28s 264 1,031

झटपट तुलना

तुलना जोडी बदला