नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: gpt-oss-120b vs Elephant

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-14

मेट्रिक gpt-oss-120b gpt-oss-120b none रिलीज़: 2025-08-05 निःशुल्क उपलब्ध Elephant Elephant medium रिलीज़: 2026-04-14
स्कोर 5.2 5.2
रैंक #80 #77
संगति 7.9 9.6
सही परीक्षण
प्रति प्रयास पास दर 38.9% 29.6%
अस्थिर टेस्ट 5 1
कुल रन 54 54
प्रति परिणाम लागत 0.221 0.000
कुल लागत $0.009 $0.000
???? ??? $0.039 / 1M $0.000 / 1M
????? ??? $0.190 / 1M $0.000 / 1M
आउटपुट टोकन 44,652 2,596
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 11.96s 1.27s
प्रतिक्रिया समय (अधिकतम) 68.97s 3.70s
प्रतिक्रिया समय (कुल) 179.34s 22.82s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.6 8.0 58.3% 1 6.03s 4,867 0
Elephant 6.6 10.0 50.0% 0 1.19s 815 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
Elephant 5.1 3.3 33.3% 1 1.30s 365 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
Elephant 3.0 10.0 0.0% 0 3.70s 562 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
Elephant 6.5 10.0 50.0% 0 979ms 246 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
Elephant 3.0 10.0 0.0% 0 925ms 24 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.6 10.0 0.0% 0 2.83s 586 0
Elephant 4.3 10.0 0.0% 0 920ms 105 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 8.4 6.9 83.3% 1 5.10s 1,982 0
Elephant 9.8 10.0 100.0% 0 987ms 82 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.5 4.8 44.5% 2 6.86s 3,904 0
Elephant 3.7 10.0 0.0% 0 867ms 166 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
Elephant 3.0 10.0 0.0% 0 2.83s 231 0

त्वरित तुलना

तुलना जोड़ी बदलें