नेविगेशन
AI BENCHY
तुलना करें चार्ट Karyapranali
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Trinity Large Preview vs Z.ai: GLM 4.7 Flash

तुलना करें:

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-06

मेट्रिक Trinity Large Preview none रिलीज़: 2026-01-27 निःशुल्क उपलब्ध Z.ai: GLM 4.7 Flash medium रिलीज़: 2026-01-19
रैंक #45 #52
औसत स्कोर 4.2 3.1
संगति 9.6 6.4
प्रति परिणाम लागत 0.000 1.040
कुल लागत $0.000 $0.042
सही परीक्षण
प्रति प्रयास पास दर 33.3% 41.7%
अस्थिर टेस्ट 1 7
कुल रन 48 48
आउटपुट टोकन 1,837 38,682
रीजनिंग टोकन 0 64,952
प्रतिक्रिया समय (औसत) 3.15s 36.84s
प्रतिक्रिया समय (अधिकतम) 8.91s 174.55s
प्रतिक्रिया समय (कुल) 50.46s 331.58s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 10.0 10.0 0.0% 0 3.59s 587 0
Z.ai: GLM 4.7 Flash 4.0 4.5 55.6% 2 27.09s 1,085 5,597
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 10.0 10.0 0.0% 0 8.91s 294 0
Z.ai: GLM 4.7 Flash 10.0 2.1 33.3% 1 65.57s 2,585 20,648
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 9.9 10.0 100.0% 0 3.26s 186 0
Z.ai: GLM 4.7 Flash 5.0 10.0 50.0% 0 1.51s 584 2,755
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 4.0 10.0 33.3% 0 877ms 25 0
Z.ai: GLM 4.7 Flash 10.0 4.4 33.3% 2 174.55s 33,000 25,394
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 3.0 9.9 0.0% 0 2.86s 124 0
Z.ai: GLM 4.7 Flash 10.0 9.7 0.0% 0 18.14s 18 2,138
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 3.5 6.7 16.7% 1 1.09s 63 0
Z.ai: GLM 4.7 Flash 5.0 5.8 66.7% 1 2.97s 388 2,181
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 4.0 10.0 33.3% 0 3.30s 291 0
Z.ai: GLM 4.7 Flash 10.0 7.2 11.1% 1 12.90s 798 5,225
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Trinity Large Preview 10.0 10.0 100.0% 0 6.67s 267 0
Z.ai: GLM 4.7 Flash 10.0 10.0 100.0% 0 15.95s 224 1,014

त्वरित तुलना

तुलना जोड़ी बदलें