नेव्हिगेशन
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemma 4 31B vs OpenAI: GPT-5.3-Codex

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-02

मेट्रिक Gemma 4 31B Gemma 4 31B medium प्रकाशन: 2026-04-02 GPT-5.3-Codex GPT-5.3-Codex medium प्रकाशन: 2026-02-05
स्कोअर 8.6 8.5
क्रमांक #5 #8
सुसंगतता 9.6 8.6
बरोबर चाचण्या
प्रति प्रयत्न पास दर 80.4% 82.4%
अस्थिर चाचण्या 1 3
एकूण रन 51 51
प्रति निकाल खर्च 0.109 4.526
एकूण खर्च $0.015 $0.544
???? ??? $0.140 / 1M $1.750 / 1M
????? ??? $0.400 / 1M $14.000 / 1M
आउटपुट टोकन्स 9,568 1,788
रिझनिंग टोकन्स 22,501 33,649
प्रतिसाद वेळ (सरासरी) 21.81s 15.76s
प्रतिसाद वेळ (कमाल) 68.92s 100.93s
प्रतिसाद वेळ (एकूण) 327.16s 267.97s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 962 2,046
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 240 1,722
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 1,822 2,951
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 4,349 8,985
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 105 888
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 533 2,035
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 8.8 7.9 88.9% 1 27.63s 1,797 5,596
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.12s 352 1,644
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492

झटपट तुलना

तुलना जोडी बदला