नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

Elephant vs Qwen: Qwen3.5-9B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-14

मेट्रिक Elephant Elephant none रिलीज़: 2026-04-14 Qwen3.5-9B Qwen3.5-9B medium रिलीज़: 2026-03-02
स्कोर 5.2 4.4
रैंक #81 #93
संगति 9.6 7.2
सही परीक्षण
प्रति प्रयास पास दर 31.5% 33.3%
अस्थिर टेस्ट 1 6
कुल रन 54 54
प्रति परिणाम लागत 0.000 0.976
कुल लागत $0.000 $0.030
???? ??? $0.000 / 1M $0.050 / 1M
????? ??? $0.000 / 1M $0.150 / 1M
आउटपुट टोकन 2,573 24,291
रीजनिंग टोकन 0 172,597
प्रतिक्रिया समय (औसत) 1.23s 73.64s
प्रतिक्रिया समय (अधिकतम) 3.81s 226.38s
प्रतिक्रिया समय (कुल) 22.16s 1104.60s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant 6.6 10.0 50.0% 0 963ms 610 0
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 2,621 12,411
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant 6.4 3.3 66.7% 1 1.39s 375 0
Qwen3.5-9B 2.6 10.0 0.0% 0 135.61s 6,150 31,393
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant 3.0 10.0 0.0% 0 3.81s 731 0
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant 6.5 10.0 50.0% 0 1.04s 246 0
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 1,383 32,113
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant 3.0 10.0 0.0% 0 927ms 24 0
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 11,549 48,475
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant 4.0 10.0 0.0% 0 854ms 106 0
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 0 30,695
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant 9.8 10.0 100.0% 0 1.03s 81 0
Qwen3.5-9B 6.4 5.8 66.7% 1 17.15s 599 4,517
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant 3.3 10.0 0.0% 0 849ms 170 0
Qwen3.5-9B 3.1 10.0 0.0% 0 33.38s 1,545 11,844
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
Elephant 3.0 10.0 0.0% 0 2.79s 230 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 444 1,149

त्वरित तुलना

तुलना जोड़ी बदलें