नेविगेशन
AI BENCHY
Your ad here

AI BENCHY तुलना

Elephant Alpha vs Qwen: Qwen3.5-9B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-23

मेट्रिक Elephant Alpha Elephant Alpha medium रिलीज़: 2026-04-14 Qwen3.5-9B Qwen3.5-9B none रिलीज़: 2026-03-02
स्कोर 5.2 4.8
रैंक #88 #98
संगति 9.6 9.6
सही परीक्षण
प्रति प्रयास पास दर 29.6% 24.1%
अस्थिर टेस्ट 1 1
कुल रन 54 54
प्रति परिणाम लागत 0.000 0.116
कुल लागत $0.000 $0.005
???? ??? $0.000 / 1M $0.100 / 1M
????? ??? $0.000 / 1M $0.150 / 1M
आउटपुट टोकन 2,596 3,951
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.27s 1.47s
प्रतिक्रिया समय (अधिकतम) 3.70s 5.91s
प्रतिक्रिया समय (कुल) 22.82s 26.43s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 6.6 10.0 50.0% 0 1.19s 815 0
Qwen3.5-9B 3.1 9.9 0.0% 0 1.71s 582 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 5.1 3.3 33.3% 1 1.30s 365 0
Qwen3.5-9B 5.2 3.4 33.3% 1 5.69s 1,006 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 3.0 10.0 0.0% 0 3.70s 562 0
Qwen3.5-9B 3.0 10.0 0.0% 0 5.91s 1,255 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 6.5 10.0 50.0% 0 979ms 246 0
Qwen3.5-9B 10.0 10.0 100.0% 0 847ms 249 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 3.0 10.0 0.0% 0 925ms 24 0
Qwen3.5-9B 3.0 10.0 0.0% 0 464ms 24 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 4.3 10.0 0.0% 0 920ms 105 0
Qwen3.5-9B 4.4 9.9 0.0% 0 552ms 99 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 9.8 10.0 100.0% 0 987ms 82 0
Qwen3.5-9B 6.5 10.0 50.0% 0 514ms 75 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 3.7 10.0 0.0% 0 867ms 166 0
Qwen3.5-9B 3.2 9.9 0.0% 0 683ms 388 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 3.0 10.0 0.0% 0 2.83s 231 0
Qwen3.5-9B 10.0 10.0 100.0% 0 1.27s 273 0

त्वरित तुलना

तुलना जोड़ी बदलें