नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-4o-mini vs Qwen: Qwen3.5-9B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-26

मेट्रिक GPT-4o-mini GPT-4o-mini none रिलीज़: 2024-07-18 Qwen3.5-9B Qwen3.5-9B medium रिलीज़: 2026-03-02
स्कोर 4.9 4.4
रैंक #104 #114
विश्वसनीयता लागू नहीं लागू नहीं
संगति 9.9 7.2
सही परीक्षण
प्रति प्रयास पास दर 22.2% 33.3%
अस्थिर टेस्ट 0 6
कुल रन 54 54
प्रति परिणाम लागत 0.122 0.976
कुल लागत $0.005 $0.030
???? ??? $0.150 / 1M $0.100 / 1M
????? ??? $0.600 / 1M $0.150 / 1M
आउटपुट टोकन 1,947 24,291
रीजनिंग टोकन 0 172,597
प्रतिक्रिया समय (औसत) 2.00s 73.64s
प्रतिक्रिया समय (अधिकतम) 7.58s 226.38s
प्रतिक्रिया समय (कुल) 21.99s 1104.60s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 4.8 10.0 25.0% 0 1.34s 186 0
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 2,621 12,411
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 3.0 8.7 0.0% 0 2.55s 347 0
Qwen3.5-9B 2.6 10.0 0.0% 0 135.61s 6,150 31,393
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 3.0 10.0 0.0% 0 7.58s 568 0
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 10.0 10.0 100.0% 0 1.27s 183 0
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 1,383 32,113
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 3.0 10.0 0.0% 0 637ms 15 0
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 11,549 48,475
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 4.0 10.0 0.0% 0 909ms 66 0
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 0 30,695
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 4.8 10.0 0.0% 0 1.27s 69 0
Qwen3.5-9B 6.4 5.8 66.7% 1 17.15s 599 4,517
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 3.7 10.0 0.0% 0 1.30s 308 0
Qwen3.5-9B 3.1 10.0 0.0% 0 33.38s 1,545 11,844
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-4o-mini 10.0 10.0 100.0% 0 2.51s 205 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 444 1,149

त्वरित तुलना

तुलना जोड़ी बदलें