नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Elephant Alpha vs Laguna Xs.2

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-29

मेट्रिक Elephant Alpha Elephant Alpha none रिलीज़: 2026-04-14 Laguna Xs.2 Laguna Xs.2 none रिलीज़: 2026-04-28 निःशुल्क उपलब्ध
स्कोर 5.2 5.0
रैंक #111 #118
विश्वसनीयता लागू नहीं 9.9
संगति 9.6 10.0
सही परीक्षण
प्रति प्रयास पास दर 31.5% 27.8%
अस्थिर टेस्ट 1 0
कुल रन 54 54
प्रति परिणाम लागत 0.000 0.000
कुल लागत $0.000 $0.000
???? ??? $0.000 / 1M $0.000 / 1M
????? ??? $0.000 / 1M $0.000 / 1M
आउटपुट टोकन 2,573 3,824
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.23s 1.68s
प्रतिक्रिया समय (अधिकतम) 3.81s 16.04s
प्रतिक्रिया समय (कुल) 22.16s 30.26s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 6.6 10.0 50.0% 0 963ms 610 0
Laguna Xs.2 3.2 10.0 0.0% 0 743ms 933 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 6.4 3.3 66.7% 1 1.39s 375 0
Laguna Xs.2 2.5 10.0 0.0% 0 1.96s 866 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 3.0 10.0 0.0% 0 3.81s 731 0
Laguna Xs.2 3.0 10.0 0.0% 0 2.01s 521 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 6.5 10.0 50.0% 0 1.04s 246 0
Laguna Xs.2 10.0 10.0 100.0% 0 646ms 246 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 3.0 10.0 0.0% 0 927ms 24 0
Laguna Xs.2 5.3 10.0 33.3% 0 371ms 33 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 4.0 10.0 0.0% 0 854ms 106 0
Laguna Xs.2 5.0 10.0 0.0% 0 16.04s 200 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 9.8 10.0 100.0% 0 1.03s 81 0
Laguna Xs.2 6.5 10.0 50.0% 0 439ms 81 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 3.3 10.0 0.0% 0 849ms 170 0
Laguna Xs.2 5.4 10.0 33.3% 0 688ms 552 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 3.0 10.0 0.0% 0 2.79s 230 0
Laguna Xs.2 3.0 10.0 0.0% 0 1.93s 392 0

त्वरित तुलना

तुलना जोड़ी बदलें