नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: gpt-oss-120b vs Owl Alpha

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-01

मेट्रिक gpt-oss-120b gpt-oss-120b none रिलीज़: 2025-08-05 निःशुल्क उपलब्ध Owl Alpha Owl Alpha medium रिलीज़: 2026-04-30
स्कोर 5.4 5.8
रैंक #106 #92
विश्वसनीयता लागू नहीं 10.0
संगति 8.2 9.5
सही परीक्षण
प्रति प्रयास पास दर 40.7% 40.7%
अस्थिर टेस्ट 4 1
कुल रन 54 54
प्रति परिणाम लागत 0.177 0.000
कुल लागत $0.009 $0.000
???? ??? $0.000 / 1M $0.000 / 1M
????? ??? $0.000 / 1M $0.000 / 1M
आउटपुट टोकन 44,652 1,596
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 11.96s 11.04s
प्रतिक्रिया समय (अधिकतम) 68.97s 58.63s
प्रतिक्रिया समय (कुल) 179.34s 198.65s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.6 8.0 58.3% 1 6.03s 4,867 0
Owl Alpha 4.8 10.0 25.0% 0 3.97s 87 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
Owl Alpha 10.0 10.0 100.0% 0 7.35s 402 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
Owl Alpha 3.0 10.0 0.0% 0 10.01s 315 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
Owl Alpha 10.0 10.0 100.0% 0 21.64s 246 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
Owl Alpha 5.3 10.0 33.3% 0 8.58s 28 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.6 10.0 0.0% 0 2.83s 586 0
Owl Alpha 4.3 10.0 0.0% 0 58.63s 98 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 9.8 10.0 100.0% 0 5.10s 1,982 0
Owl Alpha 6.3 10.0 50.0% 0 9.59s 57 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.5 4.8 44.5% 2 6.86s 3,904 0
Owl Alpha 3.4 7.2 11.1% 1 3.44s 135 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
Owl Alpha 10.0 10.0 100.0% 0 8.26s 228 0

त्वरित तुलना

तुलना जोड़ी बदलें