नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Laguna Xs.2 vs HY3 Preview

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-29

मेट्रिक Laguna Xs.2 Laguna Xs.2 medium रिलीज़: 2026-04-28 निःशुल्क उपलब्ध HY3 Preview HY3 Preview high रिलीज़: 2026-04-22 निःशुल्क उपलब्ध
स्कोर 6.2 8.5
रैंक #81 #13
विश्वसनीयता 10.0 लागू नहीं
संगति 6.9 8.8
सही परीक्षण
प्रति प्रयास पास दर 57.4% 81.5%
अस्थिर टेस्ट 7 3
कुल रन 54 50
प्रति परिणाम लागत 0.000 0.000
कुल लागत $0.000 $0.000
???? ??? $0.000 / 1M $0.000 / 1M
????? ??? $0.000 / 1M $0.000 / 1M
आउटपुट टोकन 58,141 238,920
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 6.03s 55.19s
प्रतिक्रिया समय (अधिकतम) 29.11s 149.94s
प्रतिक्रिया समय (कुल) 108.59s 938.23s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Laguna Xs.2 7.4 5.9 83.3% 2 2.60s 5,283 0
HY3 Preview 10.0 10.0 100.0% 0 32.69s 26,550 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Laguna Xs.2 6.3 3.7 33.3% 1 14.36s 7,896 0
HY3 Preview 10.0 10.0 100.0% 0 99.76s 38,167 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Laguna Xs.2 3.0 10.0 0.0% 0 15.92s 8,501 0
HY3 Preview 10.0 10.0 100.0% 0 113.09s 31,319 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Laguna Xs.2 7.1 5.6 83.3% 1 9.34s 10,472 0
HY3 Preview 6.5 10.0 50.0% 0 12.11s 4,323 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Laguna Xs.2 4.1 4.4 44.5% 2 11.12s 18,712 0
HY3 Preview 5.3 7.2 44.4% 1 109.04s 87,559 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Laguna Xs.2 4.1 10.0 0.0% 0 2.76s 1,421 0
HY3 Preview 10.0 10.0 100.0% 0 24.31s 5,490 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Laguna Xs.2 10.0 10.0 100.0% 0 1.68s 1,517 0
HY3 Preview 8.5 6.8 83.3% 1 34.02s 13,331 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Laguna Xs.2 5.3 10.0 33.3% 0 2.12s 3,168 0
HY3 Preview 9.0 7.9 88.9% 1 28.07s 21,811 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Laguna Xs.2 4.7 1.6 66.7% 1 3.39s 1,171 0
HY3 Preview 10.0 10.0 100.0% 0 78.83s 10,370 0

त्वरित तुलना

तुलना जोड़ी बदलें