नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

OpenAI: gpt-oss-120b vs Elephant Alpha

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-29

मेट्रिक gpt-oss-120b gpt-oss-120b medium रिलीज़: 2025-08-05 निःशुल्क उपलब्ध Elephant Alpha Elephant Alpha none रिलीज़: 2026-04-14
स्कोर 5.9 5.2
रैंक #103 #136
विश्वसनीयता 10.0 लागू नहीं
संगति 7.9 9.6
सही परीक्षण
प्रति प्रयास पास दर 50.0% 29.8%
अस्थिर टेस्ट 5 1
कुल रन 60 60
प्रति परिणाम लागत 0.151 0.000
कुल लागत $0.013 $0.000
इनपुट कीमत $0.039 / 1M $0.000 / 1M
आउटपुट कीमत $0.180 / 1M $0.000 / 1M
आउटपुट टोकन 17,495 2,573
रीजनिंग टोकन 46,878 0
प्रतिक्रिया समय (औसत) 22.41s 1.22s
प्रतिक्रिया समय (अधिकतम) 68.16s 3.81s
प्रतिक्रिया समय (कुल) 291.35s 22.03s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 3,518 2,177
Elephant Alpha 6.6 10.0 50.0% 0 963ms 610 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.9 5.6 33.3% 1 47.24s 847 8,618
Elephant Alpha 4.7 6.7 33.3% 1 1.39s 375 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
Elephant Alpha 3.0 10.0 0.0% 0 3.81s 731 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 241 1,114
Elephant Alpha 6.5 10.0 50.0% 0 1.04s 246 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 6,784 20,606
Elephant Alpha 3.0 10.0 0.0% 0 927ms 24 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 107 387
Elephant Alpha 4.0 10.0 0.0% 0 854ms 106 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 126 1,799
Elephant Alpha 9.8 10.0 100.0% 0 1.03s 81 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 5.3 7.2 44.4% 1 21.71s 1,790 2,264
Elephant Alpha 4.2 10.0 0.0% 0 807ms 170 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 287 1,083
Elephant Alpha 3.0 10.0 0.0% 0 2.79s 230 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
gpt-oss-120b 3.0 10.0 0.0% 0 26.51s 3,101 3,758
Elephant Alpha 0.0 0.0 0.0% 0 0ms 0 0

त्वरित तुलना

तुलना जोड़ी बदलें