नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-9B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-03-12

मेट्रिक GPT-5.4 GPT-5.4 none रिलीज़: 2026-03-05 Qwen3.5-9B Qwen3.5-9B medium रिलीज़: 2026-03-02
रैंक #51 #66
औसत स्कोर 4.5 2.6
संगति 8.9 7.4
प्रति परिणाम लागत 1.562 0.779
कुल लागत $0.094 $0.024
सही परीक्षण
प्रति प्रयास पास दर 41.7% 35.4%
अस्थिर टेस्ट 2 5
कुल रन 48 48
आउटपुट टोकन 1,819 17,930
रीजनिंग टोकन 0 139,706
प्रतिक्रिया समय (औसत) 1.48s 71.44s
प्रतिक्रिया समय (अधिकतम) 2.89s 226.38s
प्रतिक्रिया समय (कुल) 23.64s 928.77s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

औसत स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

औसत स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 7.3 11.1% 1 1.41s 388 0
Qwen3.5-9B 4.0 7.2 55.6% 1 31.54s 2,410 10,913
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 0.0% 0 2.89s 291 0
Qwen3.5-9B 10.0 10.0 0.0% 0 0ms 0 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 9.9 10.0 100.0% 0 1.04s 222 0
Qwen3.5-9B 5.0 5.6 33.3% 1 87.31s 1,383 32,113
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 4.0 7.2 44.4% 1 1.07s 50 0
Qwen3.5-9B 10.0 7.2 22.2% 1 137.75s 11,549 48,475
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.0 9.9 0.0% 0 1.78s 184 0
Qwen3.5-9B 10.0 1.6 33.3% 1 226.38s 0 30,695
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.5 10.0 50.0% 0 1.07s 81 0
Qwen3.5-9B 5.5 5.8 66.7% 1 17.15s 599 4,517
Puzzle Solving स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 4.0 9.8 33.3% 0 1.52s 357 0
Qwen3.5-9B 10.0 10.0 0.0% 0 33.38s 1,545 11,844
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 444 1,149

त्वरित तुलना

तुलना जोड़ी बदलें