नेविगेशन
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY तुलना

OpenAI: GPT-5.4 vs Qwen: Qwen3.5-27B

बेंचमार्क AI BENCHY टेस्ट सूट्स से इस समय जनरेट किए गए:: 2026-04-30

मेट्रिक GPT-5.4 GPT-5.4 none रिलीज़: 2026-03-05 Qwen3.5-27B Qwen3.5-27B none रिलीज़: 2026-02-24
स्कोर 5.9 6.0
रैंक #89 #84
विश्वसनीयता लागू नहीं लागू नहीं
संगति 9.1 9.2
सही परीक्षण
प्रति प्रयास पास दर 42.6% 44.4%
अस्थिर टेस्ट 2 2
कुल रन 54 54
प्रति परिणाम लागत 1.477 0.228
कुल लागत $0.104 $0.016
???? ??? $2.500 / 1M $0.195 / 1M
????? ??? $15.000 / 1M $1.560 / 1M
आउटपुट टोकन 2,317 3,545
रीजनिंग टोकन 0 0
प्रतिक्रिया समय (औसत) 1.51s 1.74s
प्रतिक्रिया समय (अधिकतम) 2.95s 9.39s
प्रतिक्रिया समय (कुल) 27.21s 31.32s

स्कोर के अनुसार शीर्ष मॉडल

स्कोर बनाम कुल लागत

प्रतिक्रिया समय (औसत)

स्कोर vs प्रतिक्रिया समय (औसत)

कुल आउटपुट टोकन

स्कोर vs कुल आउटपुट टोकन

श्रेणी विवरण

एंटी-एआई ट्रिक्स स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.2 8.0 8.3% 1 1.21s 406 0
Qwen3.5-27B 4.8 10.0 25.0% 0 788ms 267 0
कोडिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 2.95s 480 0
Qwen3.5-27B 10.0 10.0 100.0% 0 2.51s 381 0
संयुक्त स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 3.0 10.0 0.0% 0 2.89s 291 0
Qwen3.5-27B 2.8 1.6 33.3% 1 9.39s 1,461 0
डेटा पार्सिंग और निष्कर्षण स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 1.04s 222 0
Qwen3.5-27B 10.0 10.0 100.0% 0 1.43s 243 0
डोमेन-विशिष्ट स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.3 7.2 44.4% 1 1.07s 50 0
Qwen3.5-27B 3.0 10.0 0.0% 0 540ms 15 0
Samanya Buddhimatta स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 4.4 9.9 0.0% 0 1.78s 184 0
Qwen3.5-27B 5.0 10.0 0.0% 0 2.51s 126 0
निर्देश पालन स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 6.5 10.0 50.0% 0 1.07s 81 0
Qwen3.5-27B 6.3 10.0 50.0% 0 815ms 69 0
पहेली समाधान स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 5.6 9.8 33.3% 0 1.52s 357 0
Qwen3.5-27B 6.7 7.9 55.6% 1 1.37s 680 0
टूल कॉलिंग स्कोर संगति प्रति प्रयास पास दर अस्थिर टेस्ट सही परीक्षण प्रतिक्रिया समय (औसत) आउटपुट टोकन रीजनिंग टोकन
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Qwen3.5-27B 10.0 10.0 100.0% 0 3.54s 303 0

त्वरित तुलना

तुलना जोड़ी बदलें