नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Owl Alpha vs Laguna M.1

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-30

मेट्रिक Owl Alpha Owl Alpha none रिलीज़: 2026-04-30 Laguna M.1 Laguna M.1 medium रिलीज़: 2026-04-28 निःशुल्क उपलब्ध
स्कोर 6.0 6.3
रैंक #87 #75
विश्वसनीयता 10.0 10.0
संगति 9.1 8.6
सही परीक्षण
प्रति प्रयास पास दर 46.3% 53.7%
अस्थिर टेस्ट 2 3
कुल रन 54 54
प्रति परिणाम लागत 0.000 0.000
कुल लागत $0.000 $0.000
???? ??? $0.000 / 1M $0.000 / 1M
????? ??? $0.000 / 1M $0.000 / 1M
आउटपुट टोकन 1,671 63,822
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 7.07s 13.90s
प्रतिक्रिया समय (अधिकतम) 32.27s 53.14s
प्रतिक्रिया समय (कुल) 127.23s 250.28s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 3.4 7.9 16.7% 1 2.78s 57 0
Laguna M.1 6.6 10.0 50.0% 0 9.15s 7,839 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 10.0 10.0 100.0% 0 32.27s 450 0
Laguna M.1 4.3 1.1 66.7% 1 35.61s 14,327 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 3.0 10.0 0.0% 0 21.74s 315 0
Laguna M.1 3.0 10.0 0.0% 0 53.14s 12,272 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 10.0 10.0 100.0% 0 3.60s 246 0
Laguna M.1 10.0 10.0 100.0% 0 4.93s 2,296 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 5.3 10.0 33.3% 0 3.00s 27 0
Laguna M.1 5.3 7.2 44.4% 1 24.14s 19,020 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 4.3 10.0 0.0% 0 4.61s 80 0
Laguna M.1 4.1 10.0 0.0% 0 6.86s 1,294 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 6.4 10.0 50.0% 0 2.63s 63 0
Laguna M.1 10.0 10.0 100.0% 0 4.30s 1,626 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 5.9 7.2 55.6% 1 4.43s 202 0
Laguna M.1 3.6 7.2 22.2% 1 6.97s 3,978 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 10.0 10.0 100.0% 0 22.78s 231 0
Laguna M.1 10.0 10.0 100.0% 0 6.31s 1,170 0

त्वरित तुलना

तुलना जोड़ी बदलें