नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Owl Alpha vs Qwen: Qwen3.5-35B-A3B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-30

मेट्रिक Owl Alpha Owl Alpha medium रिलीज़: 2026-04-30 Qwen3.5-35B-A3B Qwen3.5-35B-A3B none रिलीज़: 2026-02-24
स्कोर 5.8 6.1
रैंक #91 #81
विश्वसनीयता 10.0 लागू नहीं
संगति 9.5 8.7
सही परीक्षण
प्रति प्रयास पास दर 40.7% 50.0%
अस्थिर टेस्ट 1 3
कुल रन 54 54
प्रति परिणाम लागत 0.000 0.215
कुल लागत $0.000 $0.016
???? ??? $0.000 / 1M $0.163 / 1M
????? ??? $0.000 / 1M $1.300 / 1M
आउटपुट टोकन 1,596 4,300
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 11.04s 3.82s
प्रतिक्रिया समय (अधिकतम) 58.63s 47.43s
प्रतिक्रिया समय (कुल) 198.65s 68.74s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 4.8 10.0 25.0% 0 3.97s 87 0
Qwen3.5-35B-A3B 3.4 7.9 16.7% 1 1.43s 574 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 10.0 10.0 100.0% 0 7.35s 402 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 2.67s 539 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 3.0 10.0 0.0% 0 10.01s 315 0
Qwen3.5-35B-A3B 3.0 10.0 0.0% 0 47.43s 1,833 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 10.0 10.0 100.0% 0 21.64s 246 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 1.16s 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 5.3 10.0 33.3% 0 8.58s 28 0
Qwen3.5-35B-A3B 7.7 10.0 66.7% 0 485ms 15 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 4.3 10.0 0.0% 0 58.63s 98 0
Qwen3.5-35B-A3B 6.5 3.4 66.7% 1 1.19s 114 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 6.3 10.0 50.0% 0 9.59s 57 0
Qwen3.5-35B-A3B 6.3 10.0 50.0% 0 809ms 63 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 3.4 7.2 11.1% 1 3.44s 135 0
Qwen3.5-35B-A3B 3.9 7.4 22.2% 1 1.34s 655 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Owl Alpha 10.0 10.0 100.0% 0 8.26s 228 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 2.30s 264 0

त्वरित तुलना

तुलना जोड़ी बदलें