नेविगेशन
AI BENCHY
Advertise here

AI BENCHY तुलना

Elephant Alpha vs Qwen: Qwen3.5-Flash

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-06-01

मेट्रिक Elephant Alpha Elephant Alpha medium रिलीज़: 2026-04-14 Qwen3.5-Flash Qwen3.5-Flash none रिलीज़: 2026-02-24
स्कोर 5.4 5.9
रैंक #128 #104
विश्वसनीयता लागू नहीं 10.0
संगति 9.6 9.7
सही परीक्षण
प्रति प्रयास पास दर 33.3% 41.7%
अस्थिर टेस्ट 1 1
कुल रन 60 60
प्रति परिणाम लागत 0.000 0.073
कुल लागत $0.000 $0.004
इनपुट कीमत $0.000 / 1M $0.065 / 1M
आउटपुट कीमत $0.000 / 1M $0.260 / 1M
आउटपुट टोकन 2,596 4,270
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.27s 3.74s
प्रतिक्रिया समय (अधिकतम) 3.70s 27.18s
प्रतिक्रिया समय (कुल) 22.82s 74.71s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 6.6 10.0 50.0% 0 1.19s 815 0
Qwen3.5-Flash 3.5 8.3 8.3% 1 1.32s 690 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 4.0 6.7 16.7% 1 1.30s 365 0
Qwen3.5-Flash 6.8 10.0 50.0% 0 993ms 513 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 3.0 10.0 0.0% 0 3.70s 562 0
Qwen3.5-Flash 3.0 10.0 0.0% 0 6.22s 1,794 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 6.5 10.0 50.0% 0 979ms 246 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 1.57s 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 3.0 10.0 0.0% 0 925ms 24 0
Qwen3.5-Flash 7.7 10.0 66.7% 0 905ms 15 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 4.3 10.0 0.0% 0 920ms 105 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 803ms 100 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 9.8 10.0 100.0% 0 987ms 82 0
Qwen3.5-Flash 6.3 10.0 50.0% 0 8.81s 63 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 5.3 10.0 33.3% 0 868ms 166 0
Qwen3.5-Flash 3.1 10.0 0.0% 0 10.89s 579 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 3.0 10.0 0.0% 0 2.83s 231 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 264 0
सामान्य ज्ञान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant Alpha 0.0 0.0 0.0% 0 0ms 0 0
Qwen3.5-Flash 3.0 10.0 0.0% 0 588ms 9 0

त्वरित तुलना

तुलना जोड़ी बदलें