नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

तुलना किए गए मॉडल

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-25

मेट्रिक DeepSeek V4 Flash DeepSeek V4 Flash high रिलीज़: 2026-04-24 DeepSeek V4 Pro DeepSeek V4 Pro high रिलीज़: 2026-04-24 GLM 5 GLM 5 medium रिलीज़: 2026-02-12
स्कोर 7.8 7.4 8.4
रैंक #36 #49 #15
विश्वसनीयता 10.0 3.9 लागू नहीं
संगति 7.8 9.2 8.2
सही परीक्षण
प्रति प्रयास पास दर 79.6% 77.8% 85.2%
अस्थिर टेस्ट 5 2 4
कुल रन 54 54 54
प्रति परिणाम लागत 0.277 2.524 1.188
कुल लागत $0.031 $0.329 $0.155
???? ??? $0.140 / 1M $1.740 / 1M $0.600 / 1M
????? ??? $0.280 / 1M $3.480 / 1M $2.080 / 1M
आउटपुट टोकन 1,765 1,937 20,163
रीजनिंग टोकन 90,299 82,625 58,337
प्रतिक्रिया समय (औसत) 45.41s 72.92s 23.34s
प्रतिक्रिया समय (अधिकतम) 218.13s 414.38s 79.09s
प्रतिक्रिया समय (कुल) 817.30s 1312.59s 233.40s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 8.3 10.0 75.0% 0 28.51s 140 7,770
DeepSeek V4 Pro 7.4 10.0 75.0% 0 29.33s 83 3,829
GLM 5 10.0 10.0 100.0% 0 23.66s 480 7,056
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 10.0 10.0 100.0% 0 62.48s 369 9,361
DeepSeek V4 Pro 10.0 10.0 100.0% 0 81.96s 339 6,962
GLM 5 10.0 10.0 100.0% 0 79.09s 330 19,814
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 10.0 10.0 100.0% 0 76.57s 465 7,347
DeepSeek V4 Pro 6.6 10.0 100.0% 0 71.08s 134 2,163
GLM 5 10.0 10.0 100.0% 0 28.96s 662 3,242
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 10.0 10.0 100.0% 0 28.03s 201 1,179
DeepSeek V4 Pro 8.8 10.0 100.0% 0 88.40s 795 6,370
GLM 5 7.1 5.6 83.3% 1 8.90s 567 3,734
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 4.1 4.4 44.5% 2 100.31s 27 59,249
DeepSeek V4 Pro 4.5 10.0 33.3% 0 202.43s 22 53,478
GLM 5 3.5 4.4 33.3% 2 0ms 13,176 14,137
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 6.1 3.1 66.7% 1 25.15s 79 632
DeepSeek V4 Pro 6.1 3.1 66.7% 1 23.11s 106 1,248
GLM 5 6.1 3.1 66.7% 1 14.69s 2,020 2,248
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 10.0 10.0 100.0% 0 15.36s 63 1,622
DeepSeek V4 Pro 10.0 10.0 100.0% 0 20.97s 66 2,590
GLM 5 10.0 10.0 100.0% 0 7.25s 1,001 2,129
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 6.4 4.5 77.8% 2 25.53s 193 2,597
DeepSeek V4 Pro 7.6 7.4 77.8% 1 51.47s 223 5,645
GLM 5 10.0 10.0 100.0% 0 15.64s 1,694 4,983
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
DeepSeek V4 Flash 10.0 10.0 100.0% 0 74.73s 228 542
DeepSeek V4 Pro 7.6 10.0 100.0% 0 38.69s 169 340
GLM 5 10.0 10.0 100.0% 0 15.93s 233 994

त्वरित तुलना

तुलना जोड़ी बदलें