नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Elephant vs Elephant

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-14

मेट्रिक Elephant Elephant medium रिलीज़: 2026-04-14 Elephant Elephant none रिलीज़: 2026-04-14
स्कोर 5.2 5.2
रैंक #77 #81
संगति 9.6 9.6
सही परीक्षण
प्रति प्रयास पास दर 29.6% 31.5%
अस्थिर टेस्ट 1 1
कुल रन 54 54
प्रति परिणाम लागत 0.000 0.000
कुल लागत $0.000 $0.000
???? ??? $0.000 / 1M $0.000 / 1M
????? ??? $0.000 / 1M $0.000 / 1M
आउटपुट टोकन 2,596 2,573
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.27s 1.23s
प्रतिक्रिया समय (अधिकतम) 3.70s 3.81s
प्रतिक्रिया समय (कुल) 22.82s 22.16s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant 6.6 10.0 50.0% 0 1.19s 815 0
Elephant 6.6 10.0 50.0% 0 963ms 610 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant 5.1 3.3 33.3% 1 1.30s 365 0
Elephant 6.4 3.3 66.7% 1 1.39s 375 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant 3.0 10.0 0.0% 0 3.70s 562 0
Elephant 3.0 10.0 0.0% 0 3.81s 731 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant 6.5 10.0 50.0% 0 979ms 246 0
Elephant 6.5 10.0 50.0% 0 1.04s 246 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant 3.0 10.0 0.0% 0 925ms 24 0
Elephant 3.0 10.0 0.0% 0 927ms 24 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant 4.3 10.0 0.0% 0 920ms 105 0
Elephant 4.0 10.0 0.0% 0 854ms 106 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant 9.8 10.0 100.0% 0 987ms 82 0
Elephant 9.8 10.0 100.0% 0 1.03s 81 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant 3.7 10.0 0.0% 0 867ms 166 0
Elephant 3.3 10.0 0.0% 0 849ms 170 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant 3.0 10.0 0.0% 0 2.83s 231 0
Elephant 3.0 10.0 0.0% 0 2.79s 230 0

त्वरित तुलना

तुलना जोड़ी बदलें