नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Cobuddy vs Owl Alpha

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-05-06

मेट्रिक Cobuddy Cobuddy medium रिलीज़: 2026-05-06 निःशुल्क उपलब्ध Owl Alpha Owl Alpha none रिलीज़: 2026-04-30
स्कोर 6.0 6.0
रैंक #90 #89
विश्वसनीयता 9.9 10.0
संगति 6.7 9.1
सही परीक्षण
प्रति प्रयास पास दर 57.4% 46.3%
अस्थिर टेस्ट 7 2
कुल रन 54 54
प्रति परिणाम लागत 0.000 0.000
कुल लागत $0.000 $0.000
???? ??? $0.000 / 1M $0.000 / 1M
????? ??? $0.000 / 1M $0.000 / 1M
आउटपुट टोकन 1,639 1,671
रीजनिंग टोकन 89,199 0
प्रतिक्रिया समय (औसत) 36.47s 7.07s
प्रतिक्रिया समय (अधिकतम) 309.02s 32.27s
प्रतिक्रिया समय (कुल) 656.47s 127.23s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Cobuddy 8.7 7.9 91.7% 1 10.00s 98 4,666
Owl Alpha 3.4 7.9 16.7% 1 2.78s 57 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Cobuddy 4.3 1.1 66.7% 1 53.59s 343 9,678
Owl Alpha 10.0 10.0 100.0% 0 32.27s 450 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Cobuddy 3.0 10.0 0.0% 0 47.38s 465 7,265
Owl Alpha 3.0 10.0 0.0% 0 21.74s 315 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Cobuddy 6.3 5.8 66.7% 1 17.36s 275 5,591
Owl Alpha 10.0 10.0 100.0% 0 3.60s 246 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Cobuddy 2.9 4.4 22.2% 2 128.15s 10 49,454
Owl Alpha 5.3 10.0 33.3% 0 3.00s 27 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Cobuddy 4.2 9.9 0.0% 0 23.23s 76 3,782
Owl Alpha 4.3 10.0 0.0% 0 4.61s 80 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Cobuddy 9.8 10.0 100.0% 0 11.60s 64 2,842
Owl Alpha 6.4 10.0 50.0% 0 2.63s 63 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Cobuddy 3.5 4.4 33.3% 2 12.91s 175 5,627
Owl Alpha 5.9 7.2 55.6% 1 4.43s 202 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Cobuddy 10.0 10.0 100.0% 0 11.19s 133 294
Owl Alpha 10.0 10.0 100.0% 0 22.78s 231 0

त्वरित तुलना

तुलना जोड़ी बदलें