नेव्हिगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

तुलना केलेली मॉडेल्स

AI BENCHY टेस्ट सूटमधून बेंचमार्क या वेळी तयार झाले: 2026-04-02

मेट्रिक Gemma 4 31B Gemma 4 31B medium प्रकाशन: 2026-04-02 Gemini 3 PRO Preview Gemini 3 PRO Preview medium प्रकाशन: 2025-11-18 GLM 5 Turbo GLM 5 Turbo medium प्रकाशन: 2026-03-15
स्कोअर 8.6 8.7 8.0
क्रमांक #5 #4 #19
सुसंगतता 9.6 10.0 7.9
बरोबर चाचण्या
प्रति प्रयत्न पास दर 80.4% 82.4% 76.5%
अस्थिर चाचण्या 1 0 5
एकूण रन 51 51 51
प्रति निकाल खर्च 0.109 1.406 1.509
एकूण खर्च $0.015 $0.197 $0.166
???? ??? $0.140 / 1M $0.000 / 1M $1.200 / 1M
????? ??? $0.400 / 1M $0.000 / 1M $4.000 / 1M
आउटपुट टोकन्स 9,568 1,508 11,865
रिझनिंग टोकन्स 22,501 10,084 35,632
प्रतिसाद वेळ (सरासरी) 21.81s 9.06s 17.98s
प्रतिसाद वेळ (कमाल) 68.92s 26.24s 194.23s
प्रतिसाद वेळ (एकूण) 327.16s 90.58s 305.72s

स्कोअरनुसार शीर्ष मॉडेल्स

स्कोअर विरुद्ध एकूण खर्च

प्रतिसाद वेळ (सरासरी)

स्कोअर vs प्रतिसाद वेळ (सरासरी)

एकूण आउटपुट टोकन्स

स्कोअर vs एकूण आउटपुट टोकन्स

श्रेणीवार तपशील

अँटी-एआय युक्त्या स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 10.0 10.0 100.0% 0 12.89s 962 2,046
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 14.99s 149 1,485
GLM 5 Turbo 10.0 10.0 100.0% 0 4.82s 362 3,137
संयुक्त स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Gemini 3 PRO Preview 3.0 10.0 0.0% 0 10.37s 351 952
GLM 5 Turbo 10.0 10.0 100.0% 0 13.88s 390 2,037
डेटा पार्सिंग आणि निष्कर्षण स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 10.0 10.0 100.0% 0 21.11s 1,822 2,951
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 10.84s 279 3,156
GLM 5 Turbo 10.0 10.0 100.0% 0 6.19s 577 3,632
डोमेन-विशिष्ट स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 7.7 10.0 66.7% 0 38.48s 4,349 8,985
Gemini 3 PRO Preview 5.3 10.0 33.3% 0 7.01s 15 1,195
GLM 5 Turbo 2.9 4.4 22.2% 2 71.07s 9,665 19,279
Samanya Buddhimatta स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 10.0 10.0 100.0% 0 9.57s 105 888
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 9.34s 78 374
GLM 5 Turbo 6.1 3.1 66.7% 1 10.05s 60 2,216
सूचनांचे पालन स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 10.0 10.0 100.0% 0 12.76s 533 2,035
Gemini 3 PRO Preview 9.8 10.0 100.0% 0 3.26s 69 754
GLM 5 Turbo 10.0 10.0 100.0% 0 5.38s 255 2,183
Puzzle Solving स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 8.8 7.9 88.9% 1 27.63s 1,797 5,596
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 3.91s 243 1,197
GLM 5 Turbo 7.3 5.8 55.6% 2 5.44s 315 2,702
टूल कॉलिंग स्कोअर सुसंगतता प्रति प्रयत्न पास दर अस्थिर चाचण्या बरोबर चाचण्या प्रतिसाद वेळ (सरासरी) आउटपुट टोकन्स रिझनिंग टोकन्स
Gemma 4 31B 3.0 10.0 0.0% 0 0ms 0 0
Gemini 3 PRO Preview 10.0 10.0 100.0% 0 11.96s 324 971
GLM 5 Turbo 10.0 10.0 100.0% 0 9.84s 241 446

झटपट तुलना

तुलना जोडी बदला